From 재단법인 게놈연구재단

Jump to: navigation, search

완전 자동화된 프로세스를 이용하여 대량 샘플의 엑솜 캡처를 일주일만에 완료

Genome Biology 2011


  NGS 기술의 발달로 해독 비용이 급격히 감소되고 있는 가운데, 유전체의 전체 게놈을 서열 확인(sequencing) 하는 대신, 단백질 발현부위만을 확인하는 엑솜시퀀싱 기술에 대한 관심이 높아지고 있다.


  인간의 엑솜은 전체 유전자의 1%를 차지하고 있는데, 대부분의 유전 질환이 단백질 발현 유전자의 이상에 의해 발생하므로 엑솜 연구는 유전질환 연구에서 매우 중요한 역할을 하고 있다. NGS를 이용한 엑솜시퀀싱이 가장 많이 응용되는 분야가 희귀 유전질환 분야이며, 그 밖에 암, 만성질환 분야에도 이용되는 사례가 들고 있다. 또한 진단의학 분야에서도 NGS를 이용하여 진단하려는 시도가 계속되고 있다. 해독비용 또한 전체 게놈 시퀀싱에 비해 13배나 저렴하기 때문에 적은 비용으로 새로운 변이를 찾고자 할 때 가장 유리한 방법이다.


  최근 많은 연구자들이 대용량(수천 개) 샘플에서 짧은 시간에 엑솜 영역을 캡처 할 수 있는 방법을 찾기 위해 노력하고 있다. 엑솜 캡처의 초기 버전이었던 microarray 방식은 4개의 샘플을 처리하는 데 일주일이 소요되었으며, 점차 시간을 절약할 수 있는 solution 방식으로 바뀌고 있는 추세이다. Solution 방식을 이용하여 타겟 하이브리드하는 방법은 Gnirke 박사 연구팀이 개발하여 Nature Biotechnology 2009년에 게재된 SHS(solution hybrid selection) 방식으로, 일주일 내에 한 명의 실험자가 여섯 샘플의 엑솜 캡처에서 라이브러리 제작까지 완료할 수 있을 정도로 신속할 뿐 아니라 타겟영역 증폭 효율(efficiency of targeted enrichment)이 높으며, 실험과정은 다음과 같다.


  Fisher 박사 연구팀은 완전 자동화 프로세스를 통하여 1200 샘플의 엑솜 캡처를 일주일 만에 완료할 수 있는 프로토콜을 개발하여 Genome Biology 저널에 게재하였다. 이 방법은 완전 자동화된 SHS method로서, 4명의 실험자가 1200 샘플을 일주일 만에 시퀀싱 할 수 있는 엑솜 라이브러리를 만들 수 있는 시스템이다. 이 방법으로 실험한 샘플 분석 결과, 타겟 영역 커버리지가 향상되었을 뿐 아니라, 실험 오류로 인한 중복 리드가 줄었기 때문에 얼라인 된 엑솜이 무려 94%가 되었다.


  2012년 말인 현재는 이 방법을 셋업하여 대량 샘플을 처리할 수 있는 랩이 많아져 더 이상 놀라운 기술은 아니지만, 이 논문이 publish 되었던 2011년 당시는 충분히 이슈가 되고 있었던 내용이다.


  간단히 설명하면, 우선 DNA shearing 작업이다. 기존 Covaris S2 대신 Agilent Bravo liquid handling 플랫폼인 optimized Covaris E210 플랫폼을 이용하여, DNA 손실량을 줄이고, 속도를 향상시켰다. Covaris 최적화 포인트는 shearing volume, tube type, tube breakage 제거, shearing pulse time, water degassing, water bath 내 tube 위치였다.

 

  두 번째 차이점은 정제(cleanup) 과정이다. 라이브러리 제작 중간 중간 이루어지는 컬럼 방식을 magnetic bead 방식을 이용한 방법으로 바꿔 throuput 양과 회수율을 높이는 동시에, 자동화시킨 것이다. 


  정제 방법의 개선으로 회수율이 높아짐으로 인하여, 3ug이 필요했던 input DNA 양이 100ng으로 줄었을 뿐 아니라, PCR cycle 수도 14 cycle에서 6~8 cycle로 줄게 되었다.


  세 번째 차이점은 캡처 방법인데, 완전 자동화 방법을 이용하여 4명의 실험자가 1주일에 1200샘플을 캡처함으로써 시간을 단축시키는 방식이다. 시간이 단축되었을 뿐 아니라, 성능도 훨씬 좋아졌다는 것을 다음 표를 통하여 알 수 있다.


  네 번째 차이점은 마지막 PCR 증폭 과정이다. PCR 증폭하기 전 denature 하는 과정에서 샘플 손실량이 크기 때문에, 이 단계를 없애고, PCR enzyme과 primer, bead-bait-DNA complex를 함께 증폭하는 direct off-bead PCR 방법을 이용함으로써 수율을 높일 수 있었다. 이러한 방법으로 증폭된 fragment들은 bead cleanup을 하여 bead를 제거하였다.


  마지막 차이점은 중간 과정 품질 확인과정이다. 기존 Agilent Bioanalyzer로만 확인하는 방법으로는 한계가 있기 때문에, 중간 단계에서 여러 방법을 사용하여 라이브러리 품질을 확인함으로써 시퀀싱 결과가 나오기 전에도 미리 라이브러리와 시퀀싱 결과를 예측할 수 있었다. 라이브러리 품질 확인 포인트는 sharing 후 volume 확인, PicoGreen을 이용한 DNA 농도 확인, sharing 후 사이즈 확인, Bravo 장비의 deck 위치 확인, PicoGreen을 이용한 캡처 전, 후 라이브러리의 농도 확인, 캡처 후 라이브러리의 qPCR 수치 확인, 샘플끼리 바뀌거나 섞였는지 확인하는 샘플 트랙킹 방법이 있다. 샘플 트랙킹 방법으로는 샘플을 랜덤하게 추출하여 SNP genotyping을 하는 방법인데, 시퀀싱 데이터와 genotyping 데이터의 X 크로모좀의 SNP, Y 크로모좀의 indel을 서로 비교하여 확인하는 방법이다. 이 방법은 2008년 Genome Research에 발표되었던 방법으로, 샘플 identity를 확인하는 정확성이 높은 방법으로 알려져 있다.


  Fisher 박사 연구팀은 이와 같은 프로토콜을 만들기 위하여 아래 그림과 같이 오랜 기간에 걸쳐 여러 샘플을 테스트 했다. 그 결과 2010년 5월에서야 일주일에 1200 샘플을 처리할 수 있게 되었던 것이다.


  타겟 영역 캡처 기술은 현재 핫 이슈가 되고 있으며, 점점 대량 샘플을 빠르고 정확하게 처리하기 위한 방법과 신상품들이 출시되고 있다. SHS 방법으로는 대표적으로 Agilent사의 SureSelect(전체 엑솜, 타겟)와 최근에 출시된 HaloPlex 플랫폼(타겟), 일루미나 사의 TruSeq enrichment(전체 엑솜, 타겟)이며, hybrid 방식이 아닌 캡처 방법으로는 라이프테크놀로지스 사의 Ion AmpliSeq(전체 엑솜, 타겟) 방법이 있다. 저렴한 비용으로 정확한 결과를 얻고자 하는 고객 니즈를 만족시키는 회사의 상품만이 경쟁에서 살아남게 되는 것이다.