From PGI
CLIP and PAR-CLIP sequencing 분석
마이크로RNA (microRNA, miRNA)는 약 22개의 염기서열로 이루어진 짧은 non-coding RNA로서, 유전자의 발현을 억제시키는 전사 후 조절인자(post-transcriptional regulator)의 기능을 하는 것으로 알려져 있다. 이들은 상보적인 염기 서열을 가진 표적(target) mRNA에 상보적으로 결합함으로써 표적 mRNA들을 분해시키거나 단백질로 번역되는 것을 억제한다. 이러한 조절 기능이 개체의 발생 과정에서 세포분열, 분화, 사멸을 조절할 뿐만 아니라 질환의 발병 원인과 밀접한 관련이 있다는 것이 밝혀짐에 따라 생물학 분야에서 miRNA 연구가 활발히 진행되고 있다.
동물에 존재하는 miRNA는 표적 유전자의 3’-untranslated region (3’-UTR 서열)에 결합하는 반면, 식물에 존재하는 miRNA는 일반적으로 유전자의 코딩부위(coding region)에 결합하는 것으로 알려져 있다. 특히 동물에 존재하는 miRNA가 표적 유전자와 상보 결합을 이룰 때, 몇 개의 염기만이 부분적으로 결합을 이루게 된다. 이 가운데 miRNA상의 2번에서 7번 위치에 존재하며, ‘seed region’이라고 불리는 염기서열은 표적 유전자와 반드시 상보적으로 결합해야 표적 유전자의 발현을 조절할 수 있는 것으로 알려져 있으며, 이를 “miRNA-target interactions(MTIs)”이라고 한다.
현재 MTIs를 발굴하기 위하여 일반적으로 사용되는 reporter assay와 같은 방법들은 비용면에서 비효율적이며, large-scale로 스크리닝하기 위해서는 적합하지 않다. 최근 NGS(next-generation sequencing)를 이용하여 miRNA 발현 및 MTIs를 연구한 사례들이 보고되고 있다. 예를 들어, 2008년 Nature Biotechnology의 보고에 의하면, miRDeep을 이용하여 NGS 데이터로부터 novel miRNAs를 발굴하여, 가능한 miRNA biogenesis 모델을 예측하였다. 가장 최신 버전의 miRNA 분석 프로그램은 miRDeep2인데, 정확도가 98.6~99.9%로 매우 높다. 그 외에, NGS 데이터로 miRNA expression을 detection 하거나, novel miRNAs를 발굴하기 위한 프로그램으로는 deepBase, Geoseq, miRNAkey, miRExpress가 있다.
타겟 특이적인 protein-RNA interaction을 증명하기 위해Ultraviolet(UV) crosslinking and immunoprecipitation (CLIP) 방법이 많이 사용되어 왔다. 최근에는 chromatin immunoprecipitaion (ChIP-Seq) 방법을 이용하여 NGS 데이터로부터 protein-DNA interaction을 연구하고 있다. Chi 박사 연구팀은 CLIP 기술과 NGS 기술을 접목시켜 MTIs를 발굴하는 방법을 사용해 mouse brain에서 mRNA molecule과 interaction 하는 Argonaute protein을 를 발굴하여 2009년 Nature에 보고하였다. 또, Hafner 박사 연구팀은 CLIP 기술을 modify 하여 CLIP 방법보다 resolution을 높인 “Photoactivatable-Ribonucleoside-Enhanced Crosslinking and Immunoprecipitation(PAR-CLIP)” 방법을 개발하여 2010년 Cell에 보고하였다. PAR-CLIP 기술은 RNAs 사이에 4-thiouridine (4SU)를 넣어 RNA가 더 높은 파장의 UV를 쬐게 함으로써 protein-RNA 결합이 잘 되게 함으로써 RNA co-immunoprecipitation 효율을 높이는 방법이다.
최근, 연구자들 사이에서 NGS와 CLIP-seq, PAR-CLIP-seq을 사용하여 large-scale로 MITs를 발굴할 수 있는 분석 방법을 찾기 위한 시도가 늘고 있다. CLIP-seq을 분석하기 위한 대표적인 database로는 CLIPZ, starBase, doRiNA, TarBase 6.0이 있으며, 이 중 무료로 제공되는 웹기반의 분석 시스템으로는 CLIPZ이다.
현재 PAR-CLIP seq 데이터를 분석을 위한 시스템은 유일하게 PARalyzer인데, 이는 PAR-CLIP seq 데이터 분석에 국한되어 있는 시스템이며, 실행 속도가 떨어지는 단점이 있다.
최근, 타이완 Chiao Tung 국립대 Chou 박사 연구팀은 “miRTarCLIP”, 즉, CLIP-seq과 PAR-CLIP seq 데이터 분석 시스템을 개발하여 2013년 BMC Genomics에 게재되었다. 이 소프트웨어와 case study 결과는 온라인에서 무료로 접속 가능하다(http://miRTarCLIP.mbc.nctu.edu.tw).
참고문헌
A computational approach for identifying microRNA-target interactions using high-throughput CLIP and PAR-CLIP sequencing. Chou et al. BMC Genomics 2013.
저자
글 : Lee.SeungYoun
편집 : Park.HyeonJi