Notice04 ENCODE project1

From PGI

Jump to: navigation, search

Footprint 분석으로 인간의 전사 조절을 밝혀내다!


  ENCODE 프로젝트의 결과 논문들이 연일 화제가 되고 있다. 인간 유전체의 모든 기능을 가진 요소들을 동정하는 것을 목표로 한 이번 프로젝트로 인해 국립 인간 게놈 연구소에서 단백질과 RNA 수준의 모든 요소들을 포함하여 인간 게놈의 종합적인 백과사전이 만들어졌다.


  총 24편의 논문들 중 이번 리뷰에서는 Footprint 분석을 이용한 인간 게놈의 전사 인자를 조절하는 유전자와 단백질의 cis형 결합을 조절하는 능력에 관한 내용을 다루고 있다. 논문에서 이용한 Footprint 분석DNA에 단백질이 결합하는 경로을 이용하여, DNA 분해 효소에 의한 화학적 작용으로, 단백질과 DNA의 상호작용 부위를 감지하여 분석하는 방법이다.



Footprint 방법으로 전사 인자 분석

  41가지 다양한 세포 및 조직에서 NP-40을 이용하여 DNA를 추출한 다음, DNA의 endonuclease, 칼슘, 마그네슘을 첨가한 DNase I1)을 이용하여 NP-40을 제거하였다. 500bp의 샘플을 원심분리 후 단백질 분해효소(proteinase) K를 이용하여 단백질을 제거하고, 일루미나 시퀀싱 플랫폼에 맞는 어댑터2)를 붙여 2억 7300만 개의 라이브러리를 제작하였다. 인간 참조 게놈과 당 뉴클레오티드 절단 부위를 정렬하여 FDR3) 1%범위로 식별하였다. 밝혀지지 않은 부위에 대해서는 전체를 열거하는 알고리즘을 사용하여 수행하였다.


  본 연구에서는 대립 형질의 염색질 상태에 영향을 미치는 유전자 변형에서 DNA 메틸레이션(Methylation)4)을 감지하였다. 정상 뉴클레오좀 대신 조절 DNA 지역에서 전사 단백질과의 결합은 DNase I이 많은 부위에서는 절단이 균일하지 않은 점을 이용한 것이다. 이를 이용하여 DNase I의 절단 부위는 유전자 간(intergenic, 45.7%), 인트론(intron, 37.7%), 전사개시부위(TSS; upstream of transcriptional start sites, 8.9%), 번역되지 않는 지역(UTR; untranslated regions, 1.4%)으로 다양하게 나타났다. [Figure 2. a와 b]에서도 알 수 있듯이, 다른 유전체 기능에서 DNase I의 흔적이 보이므로, 다양한 부위에서 DNase I의 절단 패턴을 분석하여 결합 부위의 조절을 기대할 수 있다.



DNase I 절단 패턴 분석


  Z-score5169.88, TRANSFAC10, JASPAR11 데이터베이스의 전사인자들과 비교하여 전사 개시부위 내에 포함된 4,262개 NRF1 단백질을 둘러싼 DNase I 절단 패턴을 분석하였다. 그 결과 NRF1 단백질 결합부위 주변의 염기는 세대를 거쳐 진화할 때, 보존되는 패턴을 보였다. Footprint 분석에서 보존되는 패턴은 높은 친화력을 가진 결합 부위와 요소가 진화에서 선택되었다는 결과를 추정할 수 있게 한다.



DNA 상호작용하는 단백질 분석

 

  Footprint 방법 외에도 ChIP-Seq5)을 진행하여 DNA와 상호작용하는 단백질을 확인하였다. 분석결과는 1000 Genome project의 참조서열을 이용하여 이형접합성 SNV(Single Nucleotide Variants)에 대한 DNase I이 많은 부위의 비율을 관찰하였다. rs4144593에서는 T/C 변이로 NF1/CTF1 단백질이 변형되었고, 그 결과 대립 염색질의 불균형으로 Footprint 분석에서는 검출되지 않았던 SNV를 발견하였다.
 

  전사인자가 유전체에 각인되어 있기 때문에, 50bp의 전사개시 부위에 20-23개의 멀티 단백질이 결합하여 번역된다. K562 세포를 ChIP-Seq을 하여 DNase I에 의해 절단된 부위를 봉우리로 나타내었고, 절단된 부위에 따라 결합하는 단백질들의 간접적인 상호작용도 예측할 수 있었다.


  USF(Upstream Stimulatory Factor)는 대표적인 당 뉴클레오티드 DNase I의 절단사례, DNase I의 민감성과 계통 분류에서도 보존되는 피부 섬유 아세포에 관련된 유전자 3가지의 절단 패턴을 그래프로 나타내었다. 파란색은 민감성을 빨간색은 계통 분류에서도 보존되는 유전자의 빈도를 나타낸다. 고정된 '염색질 구조는 인간의 전사 개시 위치를 표시해 준다. 염색체 1에서 DNase I이 과다 발현된 위치의 프로모터 결합부위를 조절하는 것을 보여준다. K562세포의 50bp에서 5,041가지 당 뉴클레오티드가 DNase I 로 절단된 사례를 열지도로 표현하였고, 보존된 것(빨간색)과 절단된 것(파란색)을 구별하여 표시하였다.


  이미 알려진 CTCF-YY1(림프종에 근육내 신호전사인자가 결합되는 상호작용) 및 TAL1-CATA1(T세포 급성 림프 백혈병 단백질에 전사 단백질이 결합되는 상호작용)등 단백질-단백질 상호작용뿐만 아니라 약하게 결합하는 말초부위의 활성화와 호환 작용, 농축 작용도 감지할 수 있게 되었다. 본 연구로 41개 세포 유형에서 683개의 독특한 단백질 결합 모델이 발견되었다. 또한 전사인자의 직접, 간접적 결합을 구별하였다. 전사 인자의 직접적, 간접적 결합에 관련된 특정 구조를 농축시켜 열 지도로 나타내었고, 결합이 강할수록 봉우리가 높고 붉게 나타내었다.



기능적 진화 패턴 분석


  새로 발견한 특정 구조의 기능적 진화 패턴을 확인하기 위해, 쥐와 인간의 간 조직의 DNase I 절단 패턴을 분석하였다. DNA가 절단되어 전사된 단백질들은 거의 동일하게 기능을 보존하며 진화한 결과를 보여주었고, 다양성이 감소한 이유는 자연 선택에 의한 해로운 대립 유전자를 제거하여 전사 기능을 조절하며 진화하였기 때문이다.


  또한 DNase I 절단으로 인해, 전사 인자의 선택뿐만 아니라 세포 선택에 관련된 유전자도 조절되는 결과를 보였다. 신경성장인자에 관련된 유전자(VGF; Nerve Growth Factor)는 36개 신경세포 유형 중 VGF를 활성화 시키는 NRSF 유전자의 결합을 조절하여 DNase I의 과다발현을 억제한다. VGF 프로모터 내의 전사를 규제하는 NRSF 유전자와 SP1, USF1, RF1과 같은 단백질들의 cis형 결합을 조절하여, 결과적으로 신경 성장 세포를 활성화하여 성장에 도움을 줄 수 있다.


  DNase I의 footprint 분석 결과로 세포 선택 유전자의 조절로 발달한 세포를 선택하거나 말초부위의 조절 역할을 나타내고 있다. 신경성장 인자에 관련된 유전자의 활성화를 위해 결합 단백질의 보존 정도를 그래프로 보이고 있다. 세포와 조직의 조절을 포함한 89가지 특정 구조에서 12가지 새로 발견한 세포 선택의 조절 유전자의 빈도를 표현하였다. 알려진 조절과 새로 알게 된 조절 유전자에 대한 말초부위의 사례를 표현하였다.



맺음말

 

  이번 연구에서는 같은 종류의 상호작용 단백질의 물리적 특성과 일치하도록, 유전자의 세포 선택의 조절 기능이 진화하는 것을 발견하였다. 새로운 기술과 광범위한 실험 데이터를 사용하여 모든 유기체의 cis형 조절6)을 유도하는 유전자를 확인하였다는 점에서 매우 가치가 높다. 세포를 선택적으로 조절하여 전사되는 단백질을 조절할 수 있다면 DNase I의 절단 패턴을 개발하고 차별화하여 다 분화성에도 접목할 수 있게 될 것이다.




  1. DNase I : 가장 대표적인 핵산내부가수분해효소의 일종. 외가닥사슬 및 2중가닥사슬DNA를 분해하여 5‘-인산말단을 갖는 분해물을 생성하는 기능을 갖는 효소. 보통의 반응조건에서 분해물은 디 뉴클레오티드에서 8~12개의 올리고 뉴클레오티드까지를 포함하며 평균적으로는 테트라 뉴클레오티드의 크기를 갖는다. 반응 초기에는 디옥시 퓨린 뉴클레오시드와 디옥시 피리미딘 뉴클레오시드 간의 결합이 우선적으로 분해된다. 2가이온의 존재에 따라 절단의 양식이 현저하게 좌우된다.
  2. 어댑터(Adapter) : 전이RNA(tRNA). tRNA분자의 5‘말단에서 34~36번 잔기의 역코돈은 mRNA의3염기 연쇄와 염기쌍을 형성함으로써 유전암호를 인식하는 분자.
  3. FDR : 다중비교 검정 방법 중 하나. Total positive에 대한 false positive의 비율을 의미. P-value의 값을 가장 큰 것부터 가장 작은 것 순서로 나열하고, 유의수준 공식을 이용하여 순차적으로 검정한다. P-value의 값을 줄여감으로써 통계적 파워가 적게 감소하게 되는 장점을 가지고 있다. 검사 개수가 증가하더라도 Bonferroni correction보다 p-value의 감소가 완만하여 true positive가 제거되는 비율이 낮아지는 장점을 가진다.
  4. DNA methylation : 메틸화 효소에 의해 DNA에 메틸기가 부가되는 과정. 원핵 생물에서는 아데닌의 N-6자리와 시토신의 5자리에, 진핵 생물에서는 시토신의 5자리에 메틸기가 붙음. 메틸화는 원핵 생물에서 유전자의 절단을 제어하기 위해, 진핵 생물에서는 세포분화나 게놈각인현상(imprinting)에서 유전자의 발현을 억제하기 위해 작용.
  5. ChIP-seq : Chromatin Immunoprecipitation의 약자로 세포내에서 이뤄지는 단백질과 DNA간의 상호작용을 알아내는 주요한 방법으로 특정 단백질과 binding 하는 DNA sequence 를 알아내는 것을 목적으로 한다. 특정 단백질과 결합된 DNA을 면역학적 방법인 antibody를 이용하여 침강시킨 후 결합된 DNA를 따로 분리하여 그 sequence를 확인한다. 이때, 해당 서열을 확인 하는 방법으로 microarray방식을 이용하면, ChIP-chip이 되고, NGS와같은 시퀀싱 방식을 이용하면 ChIP-seq이다. 이러한 방법은 유전자 발현을 조절하는 전사조절인자(transcription factor)의 bindig site와 기작을 연구하는데 많이 이용되고 있다.
  6. cis형 조절 : 하나 또는 두 유전자 좌에 두 상이한 유전자가 동일 DNA가닥에 나란히 배열된 형을 cis형이라고 하고, 불포화지방산 중에서, 탄소사슬(R)의 배치가 이중결합에 대하여 반대쪽에 있는 것을 trans형이라고 한다. 이를 조절하는 것을 cis형 조절이라 한다.



참고문헌

An expansive human regulatory lexicon encoded in transcription factor footprints

http://www.nature.com/nature/journal/v489/n7414/full/nature11212.html

http://genome.ucsc.edu/ENCODE/aboutScaleup.html

DNAse footprinting: a simple method for the detection of protein-DNA binding specificity.

http://www.ncbi.nlm.nih.gov/pmc/articles/PMC342238/pdf/nar00470-0082.pdf

Transcription factor AP1 potentiates chromatin accessibility and glucocorticoid receptor binding

http://www.cell.com/molecular-cell/retrieve/pii/S1097276511004606


저자

글 : hjpark

편집 : Thkim

키워드 : ENCODE project, footprint, DNase I, ChIP-seq, cis form, DNA methylation 등