연구자료의 통계분석: 통계분석계획으로부터 얻어진 결과만 해당 임상시험결과로 인정

[칼럼] 정형진 바이엘코리아 메디컬 디렉터·가정의학과 전문의

사진: 게티이미지뱅크

[메디게이트뉴스] 임상시험자료란 임상시험계획서에 따라 임상시험 수행 동안 발생되는 모든 정보를 말한다.(참고문헌1) 임상시험 자료관리(data management)는 연구결과 분석을 위한 질(quality) 높은 자료를 효과적으로 생성하기 위해 자료관리계획을 세우는 단계부터 데이터베이스 구축 및 자료를 수집해 데이터베이스에 자료를 입력하고, 입력된 자료의 오류를 확인, 수정한 후 데이터베이스 잠금(data base lock: DBL)까지의 과정이다.(2) 자료관리의 목적은 질 높은 자료를 제공하여 통계분석과 보고서 작성시 임상시험 결과의 신뢰성과 정확성을 높이기 위함이다.(2) (자료가 엉터리면 결과도 엉터리일 수 밖에 없다: garbage in, garbage out) 이번 시간에는 자료관리가 잘 수행되었다는 가정하에 DBL 이후 통계분석에 대해 설명한다.

임상시험을 설계할 때 자료의 통계분석 방법은 시험계획서의 통계 부분에 사전에 명확히 기술해야 한다. 통계분석 방법은 시험계획서와 별도로 통계분석계획서(statistical analysis plan: SAP)에 자세히 작성될 수도 있다. 통계분석 계획에는 분석 대상군의 정의, 결과변수에 대한 분석방법, 예상되는 분석상의 문제점을 해결하는 방법들이 포함된다.(1) 통계분석계획은 분석군에 대한 눈가림 상태에서 적절히 수정될 수 있으며, 늦어도 눈가림 해제 이전에 최종 결정돼야 한다.(1) 통계분석계획으로부터 얻어진 결과만이 확증적 시험 결과로 인정받을 수 있고, SAP에 기술되지 않았던 것은 사후분석(post-hoc analysis)이므로 탐색적 결과일 뿐이다.

통계분석에 포함될 분석 대상군은 임상시험계획서에 정의돼야 하는데 시험계획서 위반의 다양한 형태, 중도탈락, 결측치 등을 고려해 비뚤림(편향)을 최소화하고, 제1종 오류를 증가시키지 않는 방향으로 분석군을 결정한다.(3) 배정된 대로 분석(intention-to-treat: ITT) 원칙은 무작위배정된 모든 대상자를 배정된 치료군에 근거해 분석에 포함시켜야 한다는 것이다.(시험군에 배정됐으나 실제 대조군 치료를 받은 경우에도) 최초 무작위배정 상태를 그대로 유지하는 것은 비뚤림(편향) 발생을 최소화하고, 통계적으로 보수적인, 즉 두 치료군 사이에 치료효과 차이를 증명하기 어려운 방법이다.(1) ITT 원칙을 적용한 분석군을 보통 모든 분석 대상군(full analysis set: FAS)이라 하고, 우월성 검정에서 주 분석군이 된다.

이에 비해 계획서순응대상군(per protocol set: PPS)은 무작위 배정된 모든 대상자 중에서 시험계획서에 따라 임상시험을 완료한 FAS의 부분집합이다. 미리 정한 최소기간 이상 배정된 치료를 완료하고(completion of a certain prespecified minimal exposure to the treatment regimen),주 결과변수 측정치가 이용 가능하며(availability of measurements of the primary variable), 선정 기준을 포함해 시험계획서의 주요 기준을 위반하지 않은 경우로(absence of any major protocol set violations, including the violation of entry criteria) 정의된다.(1,3) PPS을 사용하면 새로운 치료가 더 유효하다고 검정할 가능성이 높아지므로 보수적인 방법이 아니다. 따라서 우월성 검정에서는 PPS을 보조 분석군으로 사용하고, 비열등성 검정에서는 PPS이 시험에 따라 통계적으로 보수적일 수도(PPS을 주 분석군으로 설정), 그렇지 않을 수도(보조 분석군으로 설정) 있다. FAS vs PPS 어떤 군을 주 분석군으로 사용하던지 간에 가장 좋은 것은 두 분석군에서 일관된 결과가 나오는 것이다. 보통 확증적 임상시험에서는 두 군을 모두 분석할 것을 권고한다. 

분석군을 정리했으니 이제 결과변수를 분석해야 하는데 결과변수의 유형에 따라 요약방법과 통계분석 방법(자료가 정규분포를 따른다고 가정하는 모수 통계 위주로 설명한다)이 달라진다. 혈압, 혈당, 체중 등 연속형 변수(continuous variable)는 평균±표준편차 혹은 중앙값[최소값, 최대값] 등으로 요약할 수 있다. 연속형 변수에 대한 산포도를 그렸을 때 분포가 좌우대칭인 종모양을 띄는 정규분포를 따른다면 평균±표준편차로 요약하고, 한쪽으로 치우친 분포를 따른다면 중앙값[최소값, 최대값]으로 제시하는 것이 적절하다.(1) 자료가 독립적인 두 집단(시험군 vs 대조군)의 측정치라면 독립표본 t 검정(t-test)을 사용해 비교하고, 자료가 같은 대상자에서 측정된 중재(치료제) 전후 측정치의 비교라면 짝지은 표본 t 검정(paired t-test)을 사용해야 한다.(2) 3군 이상에서 연속형 변수의 비교는 분산분석(analysis of variance: ANOVA)을 사용한다.

반응/무반응, 정상/비정상, 만족도, 중증도 등 범주형 변수(categorical variable)는 비율(%)과 신뢰구간(confidence interval: CI)으로 요약될 수 있다.(1) 군간 비교는 카이제곱검정(chi-square test)을 대표적으로 사용한다.

항암제 임상시험에서 대상자가 시험에 등록된 시점부터 사망할 때까지 생존기간을 일차 결과변수로 설정하고 일정기간 추적관찰한다면 이는 생존자료(survival data)가 된다.(1) 항암제 임상시험 뿐만 아니라 다양한 event-driven trial에서 어떤 사건(예: 심혈관계 사건이나 사망)이 발생하기까지 시간(time to event)을 분석하고자 한다면 생존분석(survival analysis)이 사용될 수 있다. 생존자료는 일반적으로 중앙값(50% 환자가 생존하게 되는 기간)과 중앙값에 대한 신뢰구간으로 제시될 수 있다.(1,2) 생존분포의 추정은 일반적으로 비모수적인 방법인 카플란-마이어(Kaplan-Meier) 분석을 이용하고, 추정된 생존분포의 비교는 로그순위 검정(log-rank test)을 사용한다.(1)

생존자료가 보통 몇 개월로 표시되므로 연속형 변수라고 생각할 수 있으나 연속형 변수와 구분되는 가장 큰 특징은 불완전한 자료로서 중도절단(censoring)이 발생한다는 것이다. 예를 들어 암 환자의 생존기간을 평가할 때 연구기간 동안만 관찰하므로 모든 환자가 사망할 때까지 추적관찰할 수 없다. 대상자가 시험종료시까지 계속 생존했다면 우리는 그 환자가 최소한 그 시간까지는 살아있었음을 알 뿐이며 정확한 생존기간은 알 수 없다.(1) 또한, 환자가 연구 도중 중도탈락해 추적관찰이 불가능한 경우도 마찬가지다. 따라서 불완전한 중도절단의 특성을 고려해 카플란-마이어 분석으로 생존기간을 추정(K-M estimate)하는 것이다.
 
마지막으로 교란변수를 보정하는 통계방법을 설명한다. 임상시험 결과로 관찰된 치료효과가 중재(치료법)의 차이 때문인지, 군간 기저 환자 특성(baseline patient characteristics)의 차이 때문인지 알 수 없을 수 있는데 이런 교란효과를 일으킬 수 있는 변수를 교란변수(confounding variable)라 한다.(2) (무작위배정을 하면 군간 환자 특성이 거의 비슷하지만 완전히 동일할 수는 없다) 이런 교란변수를 보정/통제하기 위해 임상시험 설계 단계에서는 층화(stratified) 무작위배정을 사용할 수 있다. 또한, 임상시험을 종료한 후 통계분석 단계에서 결과변수의 형태에 따라 보정할 수 있다. 결과변수가 연속형 변수이면 공분산분석(analysis of covariance: ANCOVA), 범주형인 경우에는 로지스틱 회귀분석(logistic regression), 생존자료이면 콕스 비례모형(Cox regression)이 주로 사용된다.(4) 다시 강조하지만 결과변수를 어떻게 요약/분석하고, 어떤 기저치 공변량(baseline covariate)을 어떻게 보정할지는 사전에 시험계획서에 명시돼야 한다. 

*감사의 글: 본 칼럼은 통계 전문가인 정승희님과 정래선님으로부터 검토와 교정을 받았습니다.
 
참고문헌

1. 임상시험 관련자를 위한 기본교재(시험자편). 식약처
2. 임상시험 관련자를 위한 전문교재. 식약처
3. ICH. Statistical principles for clinical trials. ICH E9, 1998
4. 강승호. 신약개발에 필요한 임상통계학: 임상시험 통계분석. 자유아카데미


※칼럼은 칼럼니스트의 개인적인 의견이며 바이엘코리아나 KRPIA 의견을 대변하지 않고, 본지의 편집방향과 일치하지 않을 수 있습니다.
 

댓글보기(0)

전체 뉴스 순위

칼럼/MG툰

English News

전체보기

유튜브

사람들

이 게시글의 관련 기사