From PGI
Contents
ENCODE 프로젝트 ; 유전자간 장거리 상호작용의 결과, 발현!
ENCODE 프로젝트의 결과 논문들이 연일 화제가 되고 있다. 인간 유전체의 모든 기능을 가진 요소들을 동정하는 것을 목표로 한 이번 프로젝트는 국립 인간 게놈 연구소에서 단백질과 RNA 수준의 모든 요소들을 포함하여 인간 게놈의 종합적인 백과사전을 만들었다.
총 24편의 논문들 중 이번 리뷰에서는 장거리의 유전자 발현에 연관성 있는 상호작용에 관한 내용이다. 본 프로젝트는 기능적 요소와 질병을 일으키는 변형을 조절하는 요소들을 밝히는 데 목적을 두고 시작하였고, 인간 게놈의 1%에서 유전자 말단의 조절 요소와의 종합적 상호작용을 조사하기 위해 시행되었다. GM12878, K562 세포의 유전자 발현, 프로모터의 증가하는 상호작용과 RNA 존재 사이의 상당한 상관 관계를 관찰하여, 복잡한 네트워크를 형성하기 위한 여러 장기들의 상호작용을 3차원적 맥락에서 유전자 및 조절 요소의 배치로 확인할 수 있었다.
CCCCC….? (5C가 방법이다!)
유전자 발현과 전사 개시 부위의 상호작용을 중점적으로 다룬 이번 연구는 기존의 염색체, 입체구조, 캡쳐(3C; Chromosome, Conformation, Capture)만을 분석하던 이전의 연구에 탄소와 중복 부위를 추가 조사(5C; Chromosome, Conformation, Capture, Carbon, Copy)하였다. 염색체 형태의 캡쳐 기반 방법인 이전의 연구는 하나의 관심 단백질 또는 유전자 기능적 부위들 간의 특이적인 상호 작용을 감지할 수 없었으나, 5C는 게놈의 loci 사이의 장거리 상호작용을 감지하는 프라이머1)를 사용하여 실험하였고, 유전자 말단의 조절요소 발현 부위를 표적 추적하여 상호작용의 검출을 용이하게 하였다.
본 연구는 5C 방법으로 상호 작용을 확인하였다. 절단 효소 중 하나인 HindIII로 잘린 조각과 전사 개시 부위(TSS; Transcription Start Site)와의 장거리 상호 작용을 나타내었다(붉게 표시된 부위는 GENCODE(v7)에 따른 것, 푸르게 표시된 부위는 5C 프라이머로 시작되는 장거리 HindIII 조각). 다른 염색체에 존재하는 암호화된 위치에서 측정된 5C의 상호작용 주파수로 표시하였으며, 화살표는 전사 개시 부위의 유전자 말단 조각과의 상호작용 14가지를 의미한다. K562세포에서 14가지 인코딩 지역에서 전사 개시 부위와 유전자 말단 조각의 상호작용을 열지도로 표현하였다. 동일한 암호화된 위치 내에서 유전자 내 장거리 상호작용은 다른 암호화된 위치와의 상호작용보다 자주 일어나며, 염색체 형성 지역(화살표 표시)으로 구분될 수 있다. 오렌지 색 세로 축이 전사 개시 부위에 대한 5C의 상호작용을 보여준다. 빨간색 선은 예상 상호작용 수준을 의미하며, 피크들은 GM12878 세포의 ACSL6 유전자 전사 개시 부위와 CTCF2) 유전자 결합 요소 간의 장거리 상호작용을 감지한 결과이다. 결과는 5C 신호를 Z-점수로 변환하여 해당 게놈 거리로 구분하였고, loci에 대해 예상보다 더 자주 크게 발생하는 상호작용을 확인한 것이다.
또한 반복을 통해 globin3) 유전자의 발현을 조절하는 세포 별 온오프(on/off)를 확인하여, 3개 말단 조절 요소(C-globin 유전자; HBG1, LCR(H55 사이의 globin 유전자), A-globin 증가 HS40)와 CTCF 유전자 결합 요소인 HS46, HS10 사이의 상호작용을 확인하였다.
염색질의 상태에 따라 편중되는 상호작용
각 세포 별 염색질4)의 특징과 유전자 발현 관련성에서 편중된 상호작용에 대해서도 확인하였다. K562 GM12878, HeLa-S3 세포에서 전사 개시 상호작용의 기능을 확인하고 세포 별 유사성 비율을 조사하였다. 세 가지 세포 유형에서 고유 및 중복되는 상호작용의 수를 벤 다이어그램으로 표시하였다. 세포 별 상호작용하는 염색질과의 연관성을 열지도로 표시한 것이다. 연관성은 H3K4me1, H3K4me2, H3K4me3의 염색질 노출을 조절하고, 히스톤 수정, CTCF 결합 단백질로 조절하며, DNase I 민감 부위(DHS; DNase I Hypersensitive Site)에 따라 7가지 염색질의 상태를 확인하는 게놈 전체와 세포 유형별 세분화하여 분석하였다. 7가지 염색질의 상태는 인핸서5)(E), 약한 인핸서(WE), 전사 개시 부위, 프로모터 예측 영역(PF), 격리 요소(CTCF), 예측된 저해 요소(R), 예측된 전사 요소(T)로 나눠진다. 이런 염색질의 상태에 따라 GM12878 세포의 기능적 게놈의 상호작용을 벤 다이어그램6)으로 증가, 발현, 결합, 미분류로 표시하였다. [Figure 3의 d]는 GM12878 세포의 전사 개시 부위와의 상호작용에서 발현되는 비율을 표시하였다.
전사 개시 부위의 장거리 상호작용
포괄적인 RNA 인핸서 데이터를 사용하여 전사 개시 부위의 우선적 활성화와 관련된 상호작용 여부를 조사하였다. 상호작용의 반복이 일어나는 것은 인핸서를 활성화하는 요소와 같았다. 때문에 업스트림 및 다운스트림의 전사 개시 부위의 장거리 상호작용 분포를 분석하였다.
평균적인 전사 개시 부위와의 장거리 상호작용을 수집한 자료이다. 상류 120Kb 주변이 비대칭적인 결과를 볼 수 있다. 상호작용이 조절 메커니즘에 관여하여, 전사 개시 부위가 아닌 발현을 일으키는 생산자의 표지의 유무에 따라 분류하였다. 둘째 줄에서 나타나듯이 실제로 낮은 수준에서 발현되는 가능성도 배제할 수 없다. 전사 개시 부위를 지나치는 타겟 프로모터에 연관된 장거리 게놈 조각의 수를 나타내는 것으로 인핸서와 전사 개시 부위 사이에 위치한 CTCF의 인핸서-프로모터 상호작용을 제한하였다. 79%가 하나 이상의 CTCF 결합 부위의 존재에 의해 물리적인 장거리 상호작용을 차단하지 않는 결론을 보이고 있고, 58%는 CTCF 및 코헤신(cohesion)7)에 의해 공동으로 제한하는 사실을 발견하여 추가로 수집하였다.
상호작용 네트워크
반복적인 상호작용의 네트워크에 대해 [Figure 5의 a]는 GM12878 세포에서 왼쪽 그래프는 전사 개시 부위의 발현 정도를 나타내었다(붉은 색은 반복되어 발현되는 것을 표시한 것). 가운데 그래프는 장거리 조각의 정도에 따라 반복적인 상호작용 정도를 나타내었다. 염색질 상태의 기능적 그룹당 장거리 조각의 정도에 따른 반복적인 상호작용 정도를 나타낸 것이다. K562 세포에서 ENr132 위치의 장거리 반복적인 상호작용을 나타내었다. GENCODE(V7)에 따라 게놈 좌표와 주석이 표시되었고, 장거리 조각과 발현 유무의 상관 관계를 선으로 이어 표시하여 네트워크를 형성하였다. 이 결과는 B-globin의 궤적과 여러 유전자와 말단 요소가 더 큰 클러스터에 조립 가능하다는 것을 보여준 결과이다.
맺음말
본 연구는 주변 염색질과 전사 개시 부위의 평균적인 상호작용을 수집하였다. 게놈간 거리, 순서와 반복적인 상호작용의 형성과 비대칭의 관계에 대한 일반적인 원칙을 찾았고, 인핸서와 단백질의 결합에서 상호작용에 대한 정보도 밝혀냈다. 장거리 상호작용은 유전자와 CTCF/코헤신 위치를 건너 대상의 선택과 유전자 분리에 대한 추가적인 메커니즘이 존재한다는 것을 확인하였다. 또한 기존에 이용하던 3C 분석보다 5C는 큰 유전자 집합에 대한 체계적인 매핑 유전자 요소의 상호작용을 위한 일반적인 접근 방법을 제공하였다. 유사한 고해상도 연구에서 염색질이 반복되는 것을 발견하였다. 장거리에 위치한 타겟 유전자의 조절 요소와 위치를 식별하고 게놈 전체의 연관적인 연구를 해석하는 데 중요한 분석 방법이 될 것이다.
- 프라이머(primer) : 특정 유전자 서열에 대하여 상보적인 짧은 단선의 유전자 서열 즉, oligonucleotide로 PCR진단, DNA sequencing 등에 이용할 목적으로 합성된 것임. DNA 중합효소에 의해 상보적인 유전자 서열이 합성될 때 전체 유전자 서열 중에서 primer에서부터 합성이 시작되는 기시절이 됨. 일반적으로 20∼30 base-pair의 길이로 합성하여 사용함.
- CTCF : CCCTC-binding factor
- Globin : 색소체 헴과 결합하여 헤모글로빈을 구성하는 단백질이다. 산소의 가역결합의 기능을 한다.
- 염색질 : 세포핵 속에 존재하며, 헤마톡실린 등의 염기성 색소로 염색이 되는 물질이다. 염색사나 염색체의 주성분으로 DNA와 히스톤이 결합한 핵단백질로 구성되어 있다. 염색질을 진정염색질과 이질염색질로 나누기도 한다. 진정염색질은 이상 응축을 일으키지 않고 저온에 의한 퇴색반응도 나타내지 않지만 유전자를 함유하고 있다. 이것에 비해 이질염색질은 이상응축을 나타내며, 퇴색반응으로 각 염색체에 특유한 줄무늬를 나타낸다. 유전자는 없거나 있어도 적게 존재한다.
- 인핸서(enhancer) : 유전자 속에 있으면서 DNA 주형의 구조적 변화를 유발하여 전사가 더욱 활발하게 일어나도록 촉진 작용을 하는 부분. 유전자마다 특유한 염기 배열로 구성되어 있고, 유전자 속에 어떤 위치에 존재하더라도 그 기능을 발휘할 수 있는 특성이 있다.
- 벤 다이어그램(Venn diagram) : 전체집합과 그 부분집합의 관계, 또 부분집합과 부분집합의 합집합 및 교집합, 그리고 부분집합의 전체집합에 관한 여집합 등을 폐곡선으로 나타낸 그림.
- 코헤신(cohesion) : 분자가 분자간 힘으로 집합하는 것. 기체의 액화 등에서 볼 수 있다. 접착제의 전문 분야에서는 접착제의 고분자가 2차 결합(수소결합)이나 반 데르 발스 힘에 의해 상호 결합되어 있는 상태를 이르며 접착(adhesion)에 대비하여 사용된다. 이것은 접착의 강도는 접착제의 응집력과 계면의 결합력(접착력) 양자에 의존한다는 사고에 근거하고 있다.
참고문헌
The long-range interaction landscape of gene promoters
http://www.nature.com/nature/journal/v489/n7414/full/nature11279.html
GENCODE: The reference human genome annotation for the ENCODE project.
http://genome.cshlp.org/content/22/9/1760
ENCODE Project Consortium. A user’s guide to the encyclopedia of DNA elements (ENCODE).
http://www.ncbi.nlm.nih.gov/pubmed/21526222
저자
글 : hjpark
편집 : Thkim
키워드 : ENCODE project, DNase I, DHS, H3K4me3, chromatin, Southern hybridization, KARB 단백질,KAP1, SETDB1, ZNF274, GATA1, c-jun, NRF1, ChIP-Seq, CpG methylation, Bisulfhite-Seq 등