본 내용은 개인적인 경험에 의한 자료임을 고려해 주세요.
CDISC ADaM의 Data Structure
ADaM V2.1에서 정의된 Data Structure는 크게 3가지 종류이다.
ADSL(Subject Level Structure)
BDS(Basic Data Structure)
OCCDS(Occurrence Data)
Data Structure 가 왜 필요할까? 결국 Analysis 를 위한 Structure가 필요하기 때문이다.
Data를 Analysis 를 수행하는 방법은 분석자의 성향에 따라 다를 것이다.
또한 SAS나 R, SPSS, Stata 등의 통계분석 프로그램의 특성에 따라 Programming, Procedure, Import, Join, Variable type 등에 영향을 방을 수도 있다.
다양한 형태를 가질 수 있는 data를 SDTM의 Rule을 따르면서 Analysis 가 가능한 적절한 형태로 정의할 필요가 있었다.
이후 ADaM이 정의하는 data Structure는 더 추가될 수 있다고 생각된다.
그러나 현재까지는 3개가 가장 큰 틀이라고 볼 수 있다.
ADSL은 AD+SL로 볼 수 있는데 AD는 ADaM 의 Data를 의미한다고 보면 된다. SL은 Subject Level이다. (AE는 ADAE, LB는 ADLB로 사용한다.)
ADSL와 BDS의 가장 대표적인 차이는 ADSL data의 한행에 한명에 대한 데이터만 있고, BDS는 반복측정된 data라고 볼 수도 있다.
(정확한 정의는 아니지만 ADaM을 공부하는 입장에서 알기 쉽도록 설명하기 위해 임시로 이렇게 나눈다.)
ADSL의 한 행에는 대상자의 정보(ID, 나이, 성별 등등 Demographic)과 임상시험의 정보(Protocol No., 병원정보), Randomization(Random Code, Treatment) 등이 포함된다. 그래서 SDTM의 한 대상자의 정보를 가지는 data를 Join 하여 작성한다.
BDS는 ADaM의 Rule 이 있다. ADaMIGV1.1 4.2.1 Rules for the Creation of Rows and Columns 을 참고하여 작성해야 한다. (BDS에 대해서 설명할 때 구체적으로 설명하겠다.)
Rule 1. A parameter-invariant function of AVAL and BASE on the same row that does not involve a transform of BASE should be added as a new column.
Rule 2. A transformation of AVAL that does not meet the conditions of Rule 1 should be added as a new parameter, and AVAL should contain the transformed value.
Rule 3. A function of one or more rows within the same parameter for the purpose of creating an analysis timepoint should be added as a new row for the same parameter.
Rule 4. A function of multiple rows within a parameter should be added as a new parameter.
Rule 5. A function of more than one parameter should be added as a new parameter.
Rule 6. When there is more than one definition of baseline, each additional definition of baseline requires the creation of its own set of rows.
OCCDS와 BDS는 두 data 모두 한 대상자에 대한 반복적인 혹은 여러 번의 결과가 나타나는 data이다.
두 data의 차이는 BDS는 반복측정이 계획되어 있고, 반복적으로 측정한 값(대표적으로 Vital Sign, Laboratory 등) 인 반면, OCCDS는 한 대상자에 대해서 한건도 발생하지 않을 수도 있고 매우 많이 발생할 수도 있다. (Adverse Event이거나 병용약물, 기저정보 등)
Data Structure에 대한 Rule를 이해하고, Metadata 형태로 ADaM을 작성하는 것이다.