의료 빅데이터 활용을 위한 제언

비식별화를 위한 조치가 무엇보다 중요하다

[칼럼] 아주의대 의료정보학과 한현욱 교수

그림 출처: 게티이미지뱅크

최근 의료계에서 빅데이터를 활용한 인공지능으로 대변되는 IBM 왓슨이 화제를 불러일으켰는데, 일반인들에게 충격을 안겼던 구글의 알파고 역시 그 다음 타깃으로 접근하는 분야 중 하나가 바로 의료분야이다.
 
아이러니하게도 의료분야는 그 어떤 학문보다도 서지학적 데이터베이스화가 가장 잘 구축된 분야이다. 대표적인 예로, 펍메드(PubMed)는 지구상에 존재하는 생물학 및 의학 연구의 거의 모든 초록이 온톨로지화돼 저장되어 있다.

그뿐만 아니라 특수 목적에 따라 유전체, 질병, 약물 등에 대한 다양한 생물학적 데이터가 구조화되어 데이터베이스화가 되어있는데, 더욱 놀라운 것은 이런 데이터베이스가 어떤 연구자나 자유롭게 사용할 수 있도록 개방돼 있다는 것이다.
 
반면, 임상연구에 가장 중요한 병원에서 생산되는 임상데이터는 안타깝게도 현재까지는 자유롭게 개방하기가 매우 어려운 게 현실이다. 병원데이터를 설사 개방한다고 해도 각 병원이 사용하는 병원정보시스템이 각 병원의 여건에 따라 다 다르게 구성돼 있기 때문에 이를 여러 기관이 공동으로 연구하는 데 사용하기에는 애로사항이 많다.  
 
이 때문에 의료정보의 표준화에 대한 필요성이 꾸준히 대두되고 있다. 최근 이를 위한 해결책으로 등장한 것이 바로 공통데이터모델(CDM)인데, 이는 서로 다른 병원정보시스템에서 나오는 데이터를 일정한 규약에 의해 모두 동일하게 정의하여 임상연구를 위한 빅데이터 풀로써 활용해 기관이나 국가를 뛰어넘어 국제적인 임상연구를 가능하게 한다.  
 
필자가 체감하는 병원정보시스템과 의료 빅데이터 시장의 성장은 일부 보고서에서 예측하는 수치보다 훨씬 빠르게 진행되는 것 같다. 현재 국내 내로라하는 병원들이 앞다퉈 CDM을 구축하고 있고 암 패널을 중심으로 유전체 분석 서비스를 제공하고 있다.

대형병원을 중심으로 정보화의 중요성을 비로소 인식하고 병원 정보화에 수백억 원에서 수천억 원을 써가며 시스템을 고도화하고 있다.

병원에서 십여 년간 축적한 빅데이터를 분석해 경영과 임상연구에 활용하기 위해 데이터웨어하우스가 본격적으로 구축되고 있으며, 구조화되지 않은 유전체 정보 저장을 위한 표준화 문제를 해결해 임상데이터와의 연계 분석을 위한 파이프라인을 만들기 위해 새로운 도전을 하고 있다.

그뿐만 아니라 산업계에서도 임상 및 유전체 데이터를 활용해 신약개발이나 헬스케어 애플리케이션 및 임상 데이터 분석 전문업체가 등장해 디지털헬스케어 산업의 미래를 견인하고 있다.
 
그러나 현재 연구기관이나 기업 등이 의료 데이터의 더욱 적극적인 활용을 요구하고 있지만, 아직은 데이터의 보안 문제를 이유로 실질적인 의료 데이터의 활용에는 제약이 많다.

데이터 보안 문제는 비단 의료 데이터의 문제만은 아니다. 기술이 발전함에 따라 해킹기술 또한 고도로 발전하고 있고, 개인 식별이 가능한 의료 데이터가 유출될 경우 그 사회적 파장은 훨씬 더 심각하리라 예상한다.

따라서 의료 데이터의 비식별화를 위한 조치가 무엇보다 중요하다.
 
개인정보의 유통과 유출에 대한 우려는 최근 등장한 블록체인 기술 덕분에 상당 부분 해소될 수 있을 것이라 예상된다.

블록체인 기술은 의료 빅데이터의 유통과 보안을 위한 대안으로도 제시되고 있는데, 이 기술을 이용하면 개인은 자신의 데이터가 어디서 어떻게 활용되고 있는지 모니터링이 가능할 뿐만 아니라 이론적으로 블록체인에 올라간 데이터는 네트워크상에서 해킹할 수 없다.
 
이밖에 의료 데이터의 활용 시 고려돼야 할 부분은 데이터 사용에 대한 보상 문제다.

의료 데이터의 근간이 되는 임상데이터는 현재 병원에서 보관하고 있지만, 개인건강기록(PHR) 데이터의 소유 주체는 사실 개인이다. 환자가 병원에 자신의 의료정보를 요청하면 원칙적으로 데이터를 환자에게 줘야 한다.

국내에서 아직은 PHR이 활성화되어 있지 않지만, 앞으로는 개인이 자신의 임상 및 유전체 데이터를 갖고 다니게(혹은 관리하게) 될 것이라 예상된다.

이렇게 될 경우, 개인이 자신의 데이터를 유통하는 하는 실질적 권리가 생겨날 수 있다. 이때 개인 의료 데이터의 활용 및 유통과 관련해 데이터의 주체에게 보상하기 위한 방안으로 '헬스 코인'과 같은 새로운 개념이 등장할 것으로 생각한다.
 
우리나라 정보통신(ICT) 분야는 분명 세계적인 수준이지만, 의료정보 분야에서만큼은 아직 세계적인 수준에 이르지 못한 것 같다.

기술의 문제가 아니라 제도의 문제 때문이다.

우리나라만큼 민간 의료데이터뿐만 아니라 공공 의료데이터를 잘 축적한 나라는 아마 없을 것이다.

그런데 여러 규제에 막혀 잘 축적된 데이터조차도 제대로 활용하지 못하고 있는 게 현실이다. 더 심각한 건, 디지털헬스케어 산업과 관련된 여러 기업이 국내의 각종 규제를 피해 국내를 떠나, 해외에서의 사업을 고려하고 있다는 거다.
 
국내 보건의료 데이터는 연구와 산업에 응용하는 데에는 분명 일정 한계가 있기는 하겠지만, 충분히 가치 있는 데이터다.

각 데이터 간 상호연결성에 대해 합리적 근거를 마련하고 데이터 접근성과 비용 문제 등을 조속히 해결해야 한다.

더 나아가 공공 데이터와 민간 데이터를 함께 활용할 수 있도록 정부가 법리적 규제를 하루빨리 조정할 필요가 있다.

이 경우 개인정보보호 관련 문제들이 분명 발생할 것이다. 만일 이러한 문제가 발생한다면 데이터 유통에서 발생하는 불법적 행위에 대해 강력한 제제를 가하는 조치를 취해야지 발생하지도 않은 문제 때문에 걱정만 하고 있으면 안 된다고 생각한다.   
 
현재 심평원이나 건강보험공단에서 공공빅데이터를 개방한 상황이다. 데이터를 개방했다면, 연구자들에게 있어서만은 무료로 개방하는 정책이 필요하다.

상업용으로 이용할 경우는 일정 부분 비용청구가 필요한 부분이 있겠으나, 연구자들을 대상으로 공공데이터에 대해 비용을 청구하는 것은 관련 연구 활성화를 저해하는 중요한 요소 중에 하나라 생각한다.
 
또 다른 문제는, 빅데이터를 분석하는 방법론과 도구는 너무나 다양함에도 불구하고 현재 심평원이나 건강보험공단 빅데이터 정책은 반드시 각 기관의 해당 서버에 접근해서 심평원이나 건보공단에서 제공하는 분석 도구만을 사용하도록 의무화 돼 있다는 거다.

새로운 분석 패키지나 도구를 사용해야 할 경우 반드시 사전승인과 같은 번거롭고 복잡한 과정을 겪어야 한다. 틀을 정해놓고 그 틀 안에서만 연구할 수 있도록 하는 것은 연구의 다양성을 저해하는 또 다른 요인이 될 것이다.
 
정부 기관이 데이터 활용에 대한 합리적인 파이프라인을 구성해 연구자들이 다양한 연구방법론을 활용해 연구할 수 있는 여건을 조속히 마련해주기를 기대한다.
 

#칼럼 # 한현욱 # 빅데이터 # 의료 빅데이터 # 아주의대 # 의료정보학과 # 임상데이터 # 데이터베이스 # PubMed # EMR # CDM # PHR # 디지털헬스케어 # 심평원 # 건보공단 # 건강보험 빅데이터

댓글보기(0)
전체 뉴스 순위
칼럼/MG툰
English News

전체보기

유튜브
사람들
이 게시글의 관련 기사