“빅데이터 분석 때 통계 오류 주의해야”

랜드마크 분석 기법 제시

사진: 연대 보건대학원 박소희 교수 ©메디게이트뉴스

'의료 분야의 빅데이터 활용사례'를 주제로 4일 진행된 디지털병원(KOHEA) 세미나에서는 의료 데이터의 활용사례 외에도 데이터를 분석할 때 유의해야 하는 점에 대해서 들어볼 수 있었다.
 
연대 보건대학원 박소희 교수는 보건의료 빅데이터를 활용한 사례를 소개함과 더불어, 통계는 어떻게 분석하느냐에 따라 오류가 생길 수 있다는 점을 상기시키며 이를 보완하기 위한 방안을 제시했다.
 
그는 보건의료 빅데이터 분석 사례로는, 건강보험공단의 문진자료와 중앙암등록본부의 암등록자료를 활용해 개발한 '개인별 폐암 위험 예측모형', 건강보험공단과 심평원의 전수자료를 활용한 '이상지질혈증 국가건강검진의 비용-효과 분석', 심평원 자료만을 이용한 '염증창자질환(IBD: Inflammatory Bowel Disease) 및 크론병 환자에 대한 연구'를 소개했다.
 
박 교수는 "공공기관에서 제공하는 보건의료 데이터는 사실상 2차 자료이기 때문에 간혹 중요한 위험요소(risk factor)가 결여되어 있다는 한계가 있는 반면, 국민 전체를 대상으로 한 자료라는 점에서 일반 인구집단과 환자집단이 어떻게 다른지를 비교할 수 있는 장점도 있다"고 밝혔다.
 
그는 보건의료 빅데이터에 대해 "임상시험과 같이 무작위(randomized) 조건의 환경에서 수집된 자료가 아니기 때문에 통계적인 오류가 발생할 수 있어 여러 통계기법을 적용해 이를 수정하는 노력을 기울여야 한다"고 당부했다.
 
특히 그는 약물역학연구에서 범하기 쉬운 조기발견기간 오류(immortal time bias, 혹은 선택 오류)를 방지하기 위한 방안으로 랜드마크 분석(Landmark Analysis)기법을 소개했다.
 
이 기법에 대해 그는, 대장암 환자의 생존률을 비교한 연구에서 2차 암이 발생한 환자의 경우 생존률이 더 높게 나온 통계적 오류를 수정하기 위해 2차 암 여부를 치료 후 특정 시기(랜드마크)에 생존한 환자를 대상으로 판정하고, 그 시기 이후에 이어지는 생존기간을 비교하는 방법을 예로 들었다
 
또한, 그는 연구를 위한 데이터 확보에 있어 걸림돌이 무엇인지에 대한 질문에 "한국은 주민등록번호 덕분에 보건의료 데이터 외에 통계청 자료 등도 취합할 수 있는 가능성을 갖고는 있지만, 법적인 근거가 부족하고 코호트 목적으로 수집한 정보가 아님에도 다른 목적으로 연구할 수 있느냐의 문제도 존재한다"고 답변했다.
 
이 외에도 서울의대 영상의학과 이학종 교수는 '베스트(BEST: Bundan Electronic System for Total Platform)'라 불리는 분당서울대병원이 의료영상기기 기업에 특화한 지원 플랫폼을 소개하기도 했다.
 
이 교수는 "이 플랫폼을 통해 의료기기 기업들이 가장 도움을 필요로 하는 부분 중 하나인 인허가 부분을 비롯해 다양하게 공유된 아이디어를 변호사의 컨설팅을 받아 구체화하는 역할도 지원하고 있다"고 밝혔다. 
 
서울아산병원의 사례를 소개한 동 병원 헬스이노베이션 빅데이터센터장 김영학 교수는 "조기진단 및 합병증 예측을 위한 의료지능 딥러닝 등 신기술 적용을 위해 EMR을 활용한 데이터를 구축하고 있다"고 전했다.
 
그리고 세미나를 마무리하며 KOHEA 이민화 명예이사장은 "한국은 앞선 의료인의 역량과 더불어 EMR과 PACS를 조기에 도입한 국가로서 보건의료 데이터를 잘 활용할 가능성이 있다"고 언급하며 "한국은 현재 기술보다는 제도적인 부분을 풀어나가는 게 핵심"이라고 강조했다.
 

#의료 빅데이터 # 빅데이터 활용 # 디지털병원 세미나 # 연대 보건대학원 # 박소희 # 통계 오류 # immortal time bias # 랜드마크 분석 # 분당서울대병원 # 이학종 # 서울아산병원 # 김영학 # KOHEA # 이민화

댓글보기(0)

전체 뉴스 순위

칼럼/MG툰

English News

전체보기

유튜브

사람들

이 게시글의 관련 기사