의사들을 위한 알기 쉬운 유전체의학 지상 특강③

[칼럼] 김경철 가정의학과 전문의

<3편>유전체 분석 방법, 플랫폼의 소개

사진: 게티이미지뱅크
메디게이트뉴스에서는 유전체 의학을 이해하기 쉽도록, 가정의학과 전문의이자 유전학 박사인 테라젠이텍스 바이오연구소 김경철 본부장의 칼럼을 연재합니다.

<1편>  미래의학이 다가오고 있다 
<2편>  유전체 의학의 기초, 변이(variants)가 무엇인가?
<3편>  유전체 분석 방법, 플랫폼의 소개
<4편>  임상에 적용하기 (1) 질병예측 (Prediction)
<5편>  임상에 적용하기 (2) 맞춤치료 (Personalized)
<6편>  임상에 적용하기 (3) 정밀의료 (Precision)
<7편>  빅데이터와 AI 
<8편>  액체생검 
<9편>  영양과 유전, 영양유전체
<10편> 영양과 유전, 후성유전학 
<11편> 약물과 유전, 약물유전체
<12편> 유전의학의 발달과 윤리 문제 
 
[메디게이트뉴스 윤영식 기자] 이번 편에서는 전체를 분석하는 검사법(플랫폼)에는 어떤 종류가 있고, 지난 십 수년 간 어떻게 발전해왔는지를 살펴보고자 한다. 많은 의사가 실험에 대해 구체적으로 알지 못하기에 연구를 설계하는데 어려움이 있거나, 상용화된 서비스를 이용하는데 잘못된 이해로 더 좋은 서비스를 선택하는 걸 어려워한다. 지노타이핑(Genotyping), DNA Chip(Microarray), NGS(Next-Generation Sequencing), 엑솜 시퀀싱(Exome Sequencing), 홀지놈 시퀀싱 (Whole Genome Sequencing) 등에 대해 차이를 간단하게나마 이해시키고 어떤 플렛폼으로 이를 분석하는지에 대해 설명하고자 한다.  

1. SNP 지노타이핑(SNP Genotyping)이란 무엇인가?
 
지난번 강의 때 언급한 SNP(Single Nucleotide Polymorphism)은 각각 엄마, 아빠로부터 물려받은 염기쌍의 조합이 AA, AB, BB 처럼 세 가지의 지노타입(Genotype)을 가지는데 이를 감별하는 방법을 지노타이핑이라 한다. 지노타이핑의 방법으로는 가장 오래된 방식인 '제한절편길이다형태'(RFLP: Restriction Fragment Lenghth Polymorphism)를 포함해 다양한 방식이 있다.

그 중 가장 보편적인 태그맨(TaqMan) 방법은 필자도 이미 10년 전에 익숙하게 경험했던 방식이다. 아래 그림처럼 보고자 하는 부위의 SNP 염기에 대응하는 프로브(probe) 끝에 형광물질인 FAM 혹은 VIC를 붙인 후 형광판독기를 통해 나타나는 형광색을 읽는 방식으로 SNP를 판독하는 방법이다. 384개의 웰(well)로 구성된 플레이트부터 최근에 보편적으로 사용되는 3072개 웰(well)을 갖춘 플레이트에 이르기까지 해당 플레이트에 원하는 프로브를 집어 넣어서 대량으로 보고싶은 SNP를 지노타이핑 하는 방식이다. 3072를 64로 나누면 48, 128로 나누면 24이다. 즉, 32개 SNP를 볼 때 동시에 96명의 샘플을, 64개 SNP를 볼 때 동시에 48명의 샘플을, 128개 SNP를 볼때는 동시에 24명의 샘플을 보는 방식이라 비교적 적은 수의 마커로 대량의 샘플을 보는데 도움이 되기에 질병예측검사 상용화 서비스에 최적화된 플랫폼인 것이다.   
 
[그림 1] TaqMan 검사법의 원리 및 결과(출처: 써모피셔 제공)

2. DNA Chip(Microarray)이란 무엇인가?

DNA 칩(DNA chip)이란 마이크로어레이(microarray) 혹은 유전자 칩(Gene chip) 등으로도 불리우며 슬라이드 글라스와 같은 작은 고형체(특수 처리된 유리판) 위에 적게는 수백 개에서 많게는 수십만 개까지의 유전자(혹은 DNA)를 고밀도로 배열해 놓은 것이다. DNA 칩은 분자생물학적 지식과 기술에 기계·전자공학의 기술을 접목해 완성한 근세기 최고의 기술이라고 할 수 있다. DNA칩을 사용할 때는 분석하고자 하는 유전자를 잘라내 형광물질을 입힌 다음, DNA 칩 위에 액체형태로 바른다. DNA 칩과 분석대상인 유전자에 담긴 구성요소들이 A와 T, G와 C처럼 서로 짝을 찾아 결합한다. 그 위에 레이저 빛을 쏘이면 결합유전자들은 밝은 빛을 낸다. 이 과정을 반복해 발광 위치를 확인하면 분석대상 유전자의 염기서열을 알 수 있다.

DNA 칩은 크게 cDNA 방식과 올리고 뉴클레오티드(Oligo nucleotide) 방식, 그리고 최근 등장한 염색체 수준에서 유전현상에 대한 분석을 가능하게 하는 신개념의 게놈칩 등으로 나뉜다. cDNA 칩은 한 개의 유전자가 갖고 있는 1000개에서 2000개의 염기 전체(cDNA)를 비교하는 방식이다. cDNA 칩은 유전자 기능분석, 질병 관련 유전자 진단, 유전자 치료, 임상병리학 등에 쓰인다. 올리고칩은 미국 아피메트릭스(Affymetrix)가 컴퓨터 제작에 쓰이는 기존노광(Photholithography)을 이용해 유리판 위에 수십만 개의 올리고뉴클레오티드(Oligo nucleotide)를 붙여 만들었다. 이 칩에서 각각의 올리고는 20개에서 25개의 염기로 이뤄져 있는데 대상 유전자를 100bp보다 작게 조각내서 결합하는 방법으로 유전자 발현 여부를 알아낸다. 또한, 올리고칩은 암 관련 유전자 돌연변이 진단, 유전병 관련 유전자 돌연변이 진단, 유전자 변이 가계도 작성, 장기 이식가능 조직 검사 등에 주로 사용된다.  질병관리본부의 한국인 칩 프로젝트에서 사용하는 한국인 칩이나, GWAS 연구 목적으로 사용되는 PRMA 칩 모두 올리고칩 방식의 DNA 칩이다.

앞서 설명한 SNP 지노타이핑은 수십 개에서 수백 개의 마커를 많은 샘플에서 동시에 분석할 때 효율적인 분석 플랫폼이고, DNA칩은 수백 개에서 백만 개 정도의 마커를 동시에 분석할 때 좋은 방법이다. 두 플랫폼 모두 기존에 이미 알고 있는 마커들을 디자인해서 보는 방법이지만, 다음에서 말하는 시퀀싱은 전장 유전체 혹은 한 유전자 내 전체 염기를 순서대로 보는 방식을 말한다.
 
[그림 2] SNP 칩과 DNA 칩의 실물. (좌)SNP 칩(3048 well) (우)DNA Chip(96 plates) (출처: 테라젠 제공)

3. NGS (Next-Generation Sequencing) 의 발전

DNA 염기서열을 자동으로 읽어주는 장비들은 지난 수십 년 동안 기본적으로 노벨상 수상자인 프레드릭 생거(Frederick Sanger)가 개발한 방식이었다. 그래서 생거 시퀀서(Sanger Sequencer)로 분류된다. 생거 시퀀싱이란 A,T,G,C 염기의 분자량(molecular weight)의 차이를 전기영동 내린 후 레이저 빛을 각 전기영동 밴드에 쬐면 형광물질에 따라 특이적인 파장의 빛을 발하게 되며, 이를 순서대로 읽어내 각 염기를 읽어내는 방식이다. 가장 고전적인 방식이고 지금도 시퀀싱의 확증검사(validation test)로 사용되는 방법이다. 이러한 방식으로 인간 게놈 프로젝트가 수행됐고, 비록 2년 단축되긴 했지만 인간의 전체 게놈을 해독하는 데는 무려 13년이나 걸렸다. 당시 경쟁자 역할을 하던 크레이그 벤터의 셀렐라 게노믹스에선 유전체를 듬성듬성 찢어서 읽는 방식으로 그 기간을 4년으로 단축할 수 있었다.

2007년에 미국의 생명공학 기업가인 조너스 로스버그는 베일러 의과대학의 리처드 깁스 교수와 함께 자신의 454 라이프사이언스 회사를 통해 제임스 왓슨의 전체 유전자를 분석했다. 이 때 걸린 시간은 불과 13주였으며 비용 또한 100만 달러로 현저히 줄었다. 454라는 기계는 전체 유전자를 200여 개의 크기로 구성된 염기 조각으로 나누고, 잘게 나눈 각각의 조각을 읽어낸 후 그를 한 줄로 이어 원래 30억 개 규모의 전체 유전코드로 재구성하는 방식이다. 이런 방식은 생거(Sanger) 방식과 달리 대량의 병렬 데이터 생산이 가능했는데 이러한 시퀀서를 차세대 시퀀서(Next Generation Sequencer, NGS)라 불리우며 454 기계가 최초의 NGS가 됐다.

NGS의 등장은 모든 생명과학 연구자들과 의학 분야 연구자들에게 갑자기 엑솜, 유전체에 이르기까지 방대한 DNA 데이터를 다루게 했으며, NGS를 기반으로 한 유전체 분석법도 매년 바뀌고 있을 정도로 그 발전 속도가 빠르다. 아래 표를 보면 짧은 시간에 얼마나 큰 발전을 했는지 알 수 있다. 2000년 초반 30억 달러를 들여 13년 동안 분석했던 시퀀싱 기술이 2007년 100만 달러에 4개월, 2011년에는 3천 달러에 고작 48시간 밖에 걸리지 않는 상용화된 NGS가 등장했다. 최근에는 옥스포드 나노포어라는 회사에서 DNA 분자가 막에 놓인 나노 크기의 구멍을 머리부터 꼬리까지 통과하며, 구멍의 이온 흐름으로 하나하나의 염기를 읽어내는 나노포어(Nanopore) 기술로 불과 15분만에 전장 유전체를 분석하는 기술을 선보이기도 했다.

반도체 기술의 압도적인 성능향상을 상징하는 무어의 법칙(Moore’s Law)에 견주어 볼 때, NGS가 등장한 2008년경부터는 아예 무어의 법칙을 능가하는 속도로 시퀀싱 비용이 떨어지고 분석 시간이 단축되기 시작했다. 사실은 IT 분야를 훨씬 뛰어넘는 압도적인 기술 혁신이 이 유전체 분석 분야에서 이뤄지고 있던 셈이다. 아직도 비용이 저렴하다고는 할 수 없지만 이러한 NGS의 발전이 시퀀싱 비용과 난이도를 계속 낮춰준 것은 사실이며, 이제 점점 더 중요해 지는 것은 시퀀싱의 데이터 생산이 아니라, 생산된 데이터에서 생물학적인 의미를 찾아낼 수 있는 분석이라는 점이 자명해졌다. 따라서 앞으로는 더욱 강력하고 고급스러운 바이오인포매틱스(bioinformatics) 분석에 상대적으로 더 많은 비용과 시간을 투입해야만 하는 시기를 맞이하게 될 것으로 보인다.
 
연도  주체  기술  소요시간  비용 
2000 Human Genome Project Sanger sequencing 10년 30억 달러
2000 Celera Genomics Sanger sequencing 4년 3억 달러
2007 Craig Venter Institute Sanger sequencing 4년 7,000만 달러
2007 Baylor College of Medicine Roche 454
(제임스 왓슨)
수개월 100만 달러
2007 Beijing Genome Institute Illumina, Solexa 수개월 50만 달러
2009 Stanford University Helicos, Heliscope 수개월 48,000달러
2009 서울 의대 유전체의학연구소 Illumina, Solexa, Macrogen  수개월 30,000달러
2010 Complete Genomics Complete Genomics 수개월 4,400달러
2011 Life Technology(ABI) SOLID5500, NGS(2세대) 48시간 3,000달러
2012~2013 The Ion PGM™ Next-NGS (3세대) 8시간 2,000달러
2014 ~ Oxford Nanopore(TBD) Nanopore (4세대) 15분 1,000달러
[표 1] 시퀀싱 기술의 발전사(출처: 테라젠 김경철 본부장 제공)

4. NGS 플랫폼의 종류
 
NGS에서는 기종에 따라 약간의 차이는 있지만 기본적으로 DNA 서열에 대한 증폭을 하고 그 후 형광 표식 등을 카메라로 찍어 이미지를 처리하는 과정을 거쳐 염기를 읽어낸다. 아래 그림처럼 PCR 증폭(amplication) 방식에 따라 로슈(Roche, 454)와 써모피셔(구 Life Technologies)의 기종들은 유탁액 증폭(emulsion PCR) 방식으로, 일루미나(Illumina)의 기종들은 브릿지 증폭(Bridge PCR) 방식을 사용하는 것으로 나눌 수 있다.
 
[그림 3] NGS 장비별 스펙(출처: 테라젠 제공)

NGS플랫폼은 주요 회사마다 특징이 있으므로 회사의 대표적인 장비 중심으로 소개하면 다음과 같다.

1) 로슈(Roche)
2007년 로슈의 454 장비는 인류 역사상 최초의 NGS 플랫폼으로 첫 번째 대상자는 DNA 구조를 발견해 노벨상을 받은 제임스 왓슨이었다. 이어 2009년에는 'GS Junior'라는 소형장비를 전세계 최초로 내놓았고, 이 장비를 10시간 가동해서 대략 35MB의 데이터를 생산할 수 있었다. 또 다른 장비인 'GS FLX'는 한 번에 읽을 수 있는 길이(read length)가 700bp로 주니어(Junior) 모델보다 조금 길어 23시간 동안 700MB를 생산해낸다.

두 경우 모두 한 번 가동(run)으로 생산되는 데이터 양이 다른 기종에 비해 상대적으로 적어서 주로 파이로시퀀싱(Pyrosequencing) 방식으로 사용된다. 드노보시퀀싱(De novo sequencing), 홀지놈리시퀀싱(Whole genome resequencing), 타겟 DNA 영역(Target DNA region), 메타지노믹스(Metagenomics), 그리고 RNA 분석 등 다양한 응용 분야에 폭넓게 활용할 수 있으며 데이터를 저장하는 형식은 SFF 형태이다.
 
[그림 4] 로슈 GS FLX(출처: 한국로슈진단 홈페이지)

2) 일루미나(illumina)
2017년 MIT가 뽑은 세계에서 가장 괄목할만한 혁신을 이룬 기업 50대 기업 중 1위를 차지한 회사가 일루미나였다. 2위는 테슬라, 3위는 구글, 4위가 삼성전자였다(테크놀로지 리뷰, 2017). 미국 샌디에고에 기업 본사를 둔 일루미나는 전세계 NGS 분석 시장의 매출 70%를 차지하고 있고, 이미 2012년 로슈가 기업인수 비용으로 67억 달러(7조 원)를 제시할 정도로 기업 가치가 높다. 2017년 현재 일루미나의 시가총액은 208억 달러까지 상승했다.

이 일루미나가 내놓은 대표적인 NGS 시리즈가 하이식(HiSeq) 2500, 하아식(HiSeq) 4000 등이다. HiSeq 2000의 경우, 2*100bp 리드(read)에서 11일까지의 런 타임(run time)으로 최대 540Gb에서 600Gb까지 데이터 생산이 가능했다. 최신 장비인 Hiseq 4000 경우는 이보다 훨씬 빠른 3.5일만에 30억 쌍 홀게놈 시퀀싱으로 12명을, 2일 만에 180개의 엑솜 또는 100개의 메신저 RNA 시퀀싱 데이터를 한 번에 생산할 수 있다. 2017년 초반에 출신된 차세대 장비인 노바식(NovaSeq)은 단 2일 만에 60명의 홀게놈 시퀀싱을 처리할 수 있는 성능(최대 6TB 데이터)으로 큰 기대를 모으고 있다. 일루미나의 CEO인 프란스시 데사우자(Francis deSouza)는 조만간에 1시간 내 홀게놈 시퀀싱이 가능하고 비용은 100달러까지 떨어질 수 있다고 장담을 하고 있다.

일루미나의 NGS 기법에서는 브릿지 증폭(Bridge PCR)이라고 해서 슬라이드 위에 DNA 단편을 고정시킨 후에 최대 1000 분자까지 증폭시켜 같은 서열의 DNA 단편 집단을 형성시키는 게 특징인데, 일루미나에서는 이 집단을 클러스터(cluster)라고 표현하며 이 때 염기서열의 양끝에 붙은 어댑터(adaptor)가 flow cell 표면에 부착해 이를 브릿지(Bridge) 방식이라 한다. 이 클러스터를 주형으로 네 종류 의 형광 표식 염기를 사용한 일 염기 합성반응인 SBS(Sequencing by synthesis)를 수행한다(그림 5).
 
[그림 5] 일루미나 Bridge PCR의 원리(출처: 일루미나 홈페이지)

2011년에는 소형장비인 마이식(MiSeq)도 선보였는데, MiSeq의 특징은 기존 대용량 시퀀서인 하이식(HiSeq)의 기법(chemistry)을 그대로 유지하면서 소형화에 성공해 장비의 크기와 가격을 줄이면서도 작업은 더 빠르고 간편하게 만들었다는 점이다. 35시간 이상의 런타임(run time)으로 7Gb까지 가능하다. 일루미나 시리즈의 데이터 저장 형태는 패스타큐(FastQ) 이다.
 
3) 써모피셔사이언티픽(Thermo Fisher Scientific)

써모피셔사이언티픽(이하 써모피셔)는 라이프테크노로지스(Life Technologies), 어플라이드바이오시스템(Applied Biosystem), 인버트로젠(Invirtrogen) 등 유수한 바이오 회사들을 인수 합병하면서 현재는 연매출 200억 달러에, 전세계에 6만 5천명이 근무하는 거대한 글로벌 기업으로 성장했다.

써모피셔의 대표적인 장비인 솔리드(SOLiD) 시리즈에서는 유탁액 증폭(emulsion PCR) 과정 이후의 결찰(Ligation)을 사용한 시퀀싱이 특징이다. 이 기법에서는 간격을 두면 서 두 개씩 염기를 읽는데, 프라이머 리셋(primer reset)을 통해 독립적으로 다섯 번을 반복하기 때문에, 최종적으로는 각 염기를 두 번씩 중복해서 읽어서 정확도를 높인다. 2011년에는 라이프 테크놀로지스에 소속된 아이온 토렌트(Ion Torrent)에서 반도체 기술 기반의 소형 시퀀서인 PGM(Personal Genome Machine)을 등장시켜 소형 시퀀서를 유행시켰다. 2012년에는 10Gb와 100Gb의 데이터를 생산하는 새로운 반도체 칩에 대응하는 아이온 프로톤(Ion Proton)을 발표했다. Ion PGM과 Ion Proton 모두에 적용되는 반도체 시퀀싱이란, 아래 <그림 6>처럼 웰(well) 안의 비즈(beads)에 고정된 DNA 서열에 네 종류의 염기를 순서대로 흘려 보내면서 만일 상보적인 DNA 합성이 일어나면 반도체에서 이를 직접 신호로 잡아내는 과정을 설명한다. 한 번 신호를 잡아내고 씻어내고 그 다음 순서의 염기를 흘려 보내는 주기가 몇 초 내에 이루어진다.
 
[그림 6] 반도체 시퀀싱의 원리(출처: 써모피셔)
 
4) 옥스포드 나노(Oxford Nano)

앞서 NGS의 발전에서 소개한 영국 회사인 '옥스포드 나노'는  2012년 2월 17일 플로리다주 마르코 아일랜드에서 개최된 '유전체생물학 및 기술 발전에 관한 모임(Advances in Genome Biology and Technology meeting)'에서 자사가 개발한 그리드온 시스템(GridION system)으로 분석한 DNA 시퀀싱 데이터를 처음으로 공개했다. 그런데 놀랍게도 15분 만에 시퀀싱이 되는 혁신적인 기술을 선보여 전세계를 깜짝 놀라게 했다. 여기서 사용한 나노포어 시퀀싱이란, DNA 한 가닥을 생물학적 세공(biological pore) 속으로 통과시키면서 전기전도성의 차이를 측정해 다양한 염기를 판별하는 기술을 말한다. 
 
[그림 7] 나노포어 시퀀싱의 원리(출처: MIT 테크놀로지)

주 제품인 미니온(MinION)은 시퀀서 역할을 하는 기기로 스마트폰보다 작은 크기의 초소형 장치다. 여기 끝에 USB가 달려 시퀀싱 결과가 15분 만에 바로 컴퓨터 화면에 보이는 놀라운 기술이다.

최근에는 15분만에 시퀀싱을 한 후 아이폰 같은 휴대폰에 바로 연결해서 분석 결과를 볼 수 있는 스미지온(SmidgION)의 실물이 공개됐다. 이런 신속한 결과 분석은 현장에서 바로 진단해 진료에 활용하는 포인트오브케어(Point of Care) 시대를 가져오게 할 것이다. 즉, 미지의 바이러스를 진료실 현장에서 검체를 받아 바로 시퀀싱 분석해서 원인을 파악하고 수술 전 특이 체질을 알아내어 사망의 위험을 감소시킬 수 있다. 비즈니스 세계에선 보다 광범위한 응용이 가능한데, 매장에서 화장품을 고르기 전 나의 피부 특성을 즉석에서 체크하고, 식당에서 음식을 먹기 전 맞춤 유전체 검사를 하는 날도 머지 않아 다가올 수 있다.
 
[그림 8] 스미지온(SmidgION)의 실물 모습(출처 : 옥스포드나노 홈페이지)

이 개략적인 글이 불과 10여년 만에 놀랍게 발전하고 있는 유전체 분석 시장의 흐름을 이해하고 다가올 4차 의료 혁명을 우리 임상의사들도 대비하는데 도움이 되었기를 바란다.


 

#칼럼 # 김경철 # 유전체의학 # 미래의학 # SNP Genotyping # DNA Chip # Microarray # NGS # NGS 플랫폼 # 로슈 # 일루미나 # 써모피셔 # 옥스포드 나노

댓글보기(0)

전체 뉴스 순위

칼럼/MG툰

English News

전체보기

유튜브

사람들

이 게시글의 관련 기사