From PGI
Contents
장미과의 매화, 기원을 찾아서
도산월야영매(陶山月夜詠挴)
뜰을 거니노라니 달아 사람을 쫓아오네.
매화꽃 언저리를 몇 번이나 돌았던고.
밤 깊도록 오래 앉아 일어나기를 잊었더니
옷 가득 향기 스미고 달그림자 몸에 닿네
매서운 추위를 이겨내고, 다른 꽃보다 먼저 꽃봉오리를 피우는 매화는 장식용, 과일 등으로 3천여 년 전부터 중국에서 재배되어 왔다. 매화가 과실이라는 사실을 아는 사람은 드문데, 매화는 장미과에 속하는 낙엽교목으로 꽃을 매화라고 하고 열매를 매실이라고 하는 과실나무이다.
장미과(Rosaceae)는 속이 100가지, 종이 3,000여 종이 되는 세계에서 세 번째인 경제적으로 중요한 식물이다. 과일의 종류에 따라 4가지(Rosoideae, Prunoideae, Spiraeoideae, Maloideae) 아속으로 구분되는데, 매화는 Rosoideae 아속에 속한다. Rosaceae는 장미과에서 분기시기가 가장 최근인 속으로 유전적으로 급속한 변이가 일어나 공동파생형질(synapomorphy)1)을 쉽게 식별이 불가능하다. 계통분류의 상당한 다양화를 확인 가능하며, 식물의 환경, 염색체 수, 과일의 유형 등이 독립적인 진화를 거듭하였다.
이에 중국 남경대학교 연구진들이 중국 티벳의 Tongmai, Bomi 도시에서 수집한 매화 야생종의 신선한 어린 잎에서 추출한 샘플을 이용하여 180, 500, 800bp, 2, 5, 10, 20, 40Kb로 다양한 라이브러리를 제작하여'de novo sequencing(101x)'을 수행하였다. SOAPdenovo(v 1.05)와 Brujin 그래프를 사용하여 어셈블리하여 8개 염색체, 280Mb의 83.9%를 매핑하여 유전자 지도를 완성하였다.
그림 1 매화(Prunus mume), 사과(Malus domestica), 딸기(Fragaria vesca)
매화(Prunus mume, 2n=16)는 3~5년의 다년생 나무로, 조기 개화(늦겨울, 초봄)가 가능한 식물이며, 장미과 중 최초 유전체 해독 종이다. 완성된 유전 정보를 이용하여 장미과 9개 조상 염색체를 재구성하였고, 세 가지 주요 목(사과(Malus domestica, 2n=34), 딸기(Fragaria vesca, 2n=14), 복숭아(Prunus persica, 2n=16)와 비교)에서 염색체 융합, 분열, 중복을 확인하였다. 또한 전사체 분석(RNA-Seq)을 이용하여 내생휴면, 면역반응에 관련된 전사체를 확인하여 장미과 식물의 진화에 대한 통찰력을 제공하였다.
이번 연구에서 유전적 다양성을 통해 번식작업을 향상시킬 수 있을 것으로 예측되며, 사과나 딸기 등의 유전 정보와 매화의 유전정보로 장미과 조상 유전체를 유추할 수 있었다. 또 향기, 개화시기, 질병저항 등 가치가 있는 특성에 중요한 1,154개 후보 유전자를 확인하였다.
매화 유전체 해독
그림 2 매화 전장유전체 지도 생성
과일 나무에 대한 참조 게놈을 구성하는 것은 인공적인 접목과 성별 구분 없이 복제되는 이형접합성(heterozygosity)2) 때문에 어렵다. 중국 티벳의 Tongmai, Bomi 도시의 밀폐적인 지역적 특성으로 자체 수정을 세대에 거쳐 이뤄, 이형접합성이 제한된 야생 샘플을 이용하여 Illumina Genome Anaylzer II를 사용하여 해독하였다. 다양한 크기의 라이브러리를 어셈블리하여 0.03% 이형접합성 속도를 관찰하였다.
표 1 매화 유전체 어셈블리 통계치
[그림 2]은 매화의 전장유전체 지도를 보여주는 것으로, 자동화된 전장유전체 매핑 방법을 수행한 결과이다. 제한 효소인 BamHI과 NheI를 사용하여 300배 고밀도 유전자 지도 생성한 것이다. [표 1]은 기존의 contig나 scaffold보다 whole-genome mapping3) 방법을 이용하면 N50이 578Kb에서 1.1Mb로 크게 향상하는 것을 보여준다. N50은 전체 contig 총합 길이의 절반과 같거나 큰 상위 contig들의 총합 중 가장 짧은 contig의 길이로, N50이 얼마나 길게 나오느냐가 어셈블리의 질을 평가하는 잣대 중 하나로 사용된다.
그림 3 매화의 8개 염색체 연관성
[그림 3]는 매화의 8개 염색체의 779개 SNP 마커를 이용하여 연관성을 파악한 전장유전체 지도이다. Whole-genome mapping 방법을 이용하여 퀄리티를 높여 참조 유전체로서의 품질을 개선하였으며, 분자 마커를 이용하여 번식과 복제에 도움이 될 것이다.
매화 유전체의 반복적인 서열길이는 106.8Mb로 전체 유전체의 45%에 해당한다. 반복적인 서열 중 97.9%는 트랜스포존(transposon, 이동성 유전인자)으로 매화에서는 Copia, Gypsy4) 가족이 보존율이 가장 높다. 또한 매화의 5개 주요 조직(새싹, 과일, 뿌리, 줄기, 잎)을 전사체 분석(RNA-Seq)하여 11.3Gb를 생산했다. 딸기는 34,809개, 사과는 57,386개보다 적은 31,390개 단백질 코딩 유전자를 보유하고 있는 매화는 4.6개 엑손당 하나의 유전자를 가지고 있으며, annotation은 Swissprot, GO, TrEMBL, InterPro, KEGG의 정보를 이용하여 98.3% 커버하였다.
그림 4 매화, 사과, 딸기의 종 분화 이후 전장유전체 복제부위
또 이번 연구에서는 장미과 유전체의 진화를 살펴보았는데, 4DTv(fourfold degenerate site)5) 방법을 이용하여 확인하였다. [그림 4]에서는 매화, 사과, 딸기의 종 분화 이후의 전장유전체 복제부위를 분석한 결과를 보여준다. [그림 4]의 a에서는 종 분화 이후 유전자 간의 복제 거리를 알 수 있는데, 매화-매화간의 거리가 사과-사과, 매화-사과보다 먼 것을 볼 수 있다. [그림 4]의 b에서는 매화 염색체 8개 사이 유전자 복제 거리를 나타내는데, A1, A4, A7, A10, A13, A16, A19 등 7가지 공통조상 그룹의 연관성을 보여준다.
그림 5 장미과 유전체 진화모델
[그림 5]는 장미과 9개 조상 염색체를 복원하기 위해, 유전체 내(intergenomic), 유전체 간(intragenomic) 분석을 통해 장미과의 사과, 딸기, 매화의 염색체 융합, 분열, 중복을 확인하는 유전체 진화모델이다. 매화와 사과 사이 유사 유전자는 4,545개로 사과는 96.9%의 매화 유전체를 커버하였으며, 딸기와 사과 사이의 유사 유전자는 2,031개로 딸기는 88.8%의 매화 유전체를 커버하였다. 조상에서 유래된 11개 유전자가 융합과 분열을 거쳐, 사과는 5개 유전자, 딸기는 15개 유전자가 각 염색체 구조에 영향을 끼쳤고, 매화는 11개 유전자가 4, 5, 7번 염색체 구조에 영향을 끼쳤다.
매화의 조기 개화
그림 6 매화의 DAM 유전자 6개의 배열
매화는 0 ℃ 이하의 이른 봄, 추운 날씨에 적응하고 내생휴면(endodormancy)6)에서 깨어나 개화하는 식물이다. 식물의 내생휴면이란 환경을 극복하기 위해 생육의 특정 단계에서 일시적으로 생장활동을 멈추는 현상으로 호흡을 극도로 제한하면서 생장을 거의 정지한다. 매화는 내생휴면에 관련된 DAM(dormancy-associated MADS-box transcription factors) 유전자를 6개 가지고 있는데, 그 배열이 특징적이다.
[그림 6]의 a에서는 매화 유전체에서 DAM 유전자를 확인한 것이고, b에서는 DAM 유전자의 구조를 확인한 것이다. 추위에 장시간 노출 시 DAM 유전자는 발현이 낮거나 억압되는 경향을 보인다. 특히 DAM3, DAM5, DAM6 유전자의 협동으로 인한 발현은 꽃 봉오리의 개화를 억압하는데, 사과나 딸기에서는 이러한 DAM 유전자 간의 협동이 없다.
뿐만 아니라 장미과 조상 유전체의 DAM 유전자에는 CBF(C-repeat-binding transcription factors) 전사체가 결합하는데, CBF 전사체는 하루 중 최적의 성장 온도에서 강한 휴지기를 갖는 특징을 발현한다. 이와 같은 현상은 사과에서 PpCBF1 유전자가 과발현을 조절하여 조기개화를 막으며, EeDAM1 유전자가 추위 스트레스 반응을 조절하는 것과 관련이 있다.
자연적인 질병에 저항하는 매화
그림 7 LRR-RLK 비교
매화는 자연적인 질병에도 저항력이 강하다. 매화 유전체는 253개 LRR-RLK(leucine-rich repeat receptor-like kinase)가 있다. [그림 7]은 매화의 LRR-RLK 유전자 가족에서 총 면역 유전자 수에 비해 LRR-XI와 LRR-XII 유전자 수가 애기장대(Arabidopsis thaliana) 221개, 카카오(Theobroma cacao) 253개, 검은시나무(Populus trichocarpa) 436개 보다 많아 자연적 질병에 저항력이 강하다. 핵에 결합되는 내성 유전자(nucleotide-binding site-coding resistant gene)는 매화가 411개로 가장 많고, 애기장대나 딸기에 비해 2배에 가까운 수치이다.
그림 8 매화의 각 조직에서 PR10 유전자 과발현 관련성
또한 질병 유전에 연관된 단백질(PR; Pathogenesis-related)은 다양한 스트레스 자극에 의해 발현이 유도되는데, 매화는 환경 스트레스에 적응된 식물이다. [그림 8]은 매화의 각 조직의 전사체를 분석(RNA-Seq)하여 뿌리와 잎에서 특히 많은 PR 단백질을 발현시키는 PR10 유전자를 확인하였다. PR10 유전자는 100Kb의 클러스터를 형성하여 뿌리와 잎에서 발현되며, 주로 염분작용과 가뭄, 곰팡이 감염 등의 반응에 관련이 있다.
매화의 꽃 향기
그림 9 매화, 딸기, 애기장대에서 BEAT 유전자의 계통 연관성
매화 꽃은 가벼운 휘발성 분자의 복잡한 혼합물이다. 꽃 향기는 많은 식물의 생식과정에서 중요한데, 매화 꽃은 신남산(cinnamic acid) 경로에서 페닐프로파노이드(phenylpropanoid), 벤제노이드(benzenoid), 테르펜(terpene) 혼합물이 존재한다. 신남산은 달콤하고 발삼, 앰버의 향기를 가진 백색의 결정으로 시나믹 에스테르의 원료로서 향수로 이용되는 원료이다.
또한 매화는 benzyl alcohol acetyltransferase(BEAT)와 같은 휘발성 화합물의 생합성에 연관된 유전자 34개를 가지고 있다. 사과 16개, 딸기 14개, 포도 4개, 복숭아 17개, 애기장대 3개에 비해 많은 수를 가지고 있는 매화는 벤질 아세테이트의 과발현으로 특별한 향기를 발산하여 번식한다.
맺음말
매화 유전체의 해독으로 꽃 식물의 3분의 1을 차지하는 장미과 종의 레퍼런스 유전체를 구축하였다. 세계 온대 지역의 주요 과일 작물인 사과는 높은 이형 접합성이고 1,629개 metacontig의 결과로 유전체 지도를 구성하였고, 딸기는 240Mb 유전체에서 고부가가치 과일의 기능 유전자 연구에 이용하지만 다배체 유전체라서 연구가 힘들었다.
그러나 이번에 해독된 매화의 경우 격리된 지역에서 자체수정에 거쳐 동형 접합성이고, 낮은 이형접합도로 280Mb 유전체이다. NGS를 통한 유전체 해독을 통해, 유사한 유전체 구성을 가진 다른 식물 종의 고품질 최초 유전체 해독이 이루어졌다. 이번 연구를 통해 장미과의 진화에 대한 지식과 전사체 분석으로 매화의 내생휴면, 질병저항, 꽃 향기 메커니즘에 관련된 정보를 확인 할 수 있었다.
- 공동파생형질(synapomorphy) : 외군비교(外群比較) 등을 이용하여 극성을 추정한 결과, 파생적이라 판정된 형질상태를 공유하는 현상.
- 이형접합성(heterozygosity) : 서로 다른 2종이나 변이주 또는 종족사이에서 생겨난 자손. 상이한 대립유전자의 쌍을 갖는 조건.
- whole-genome mapping : 전장유전체를 정확하고 높은 밀도의 물리적 지도를 수행하기 위한 방법
- Copia, Gypsy : Retroposon 중 하나. 전사된 분자가 역전사되어 많은 copy가 genome내에 분포한다. 역전사효소를 포함하고 LTR(ling terminal repeat)을 함유한 LTR형 retroposon이다.
- 4DTv(fourfold degenerate site) : 전장유전체 복제 또는 종 간 특징을 각 유사 유전자 간 거리로 측정하는 방법
- 내생휴면(endodormancy) : 식물체 자체에 그 원인이 있는 휴면. 자발휴면과 같은 의미로 사용된다. 적합한 환경조건이 부여되어도 생장을 하지 않는다.
참고문헌
The genome of Prunus mume
http://www.nature.com/ncomms/journal/v3/n12/full/ncomms2290.html
The genome of woodland strawberry (Fragaria vesca).
http://www.nature.com/ng/journal/v43/n2/full/ng.740.html
Comparative analysis of rosaceous genomes and the reconstruction of a putative ancestral genome for the family.
http://www.biomedcentral.com/1471-2148/11/9
저자
글 : Park.hyeonji
편집 : Park.hyuna
키워드 : 장미과(Rosaceae), 매화(Prunus mume), 사과(Malus domestica), 딸기(Fragaria vesca), 복숭아(Prunus persica), 애기장대(Arabidopsis thaliana), 카카오(Theobroma cacao), 검은시나무(Populus trichocarpa), de novo sequencing, nucleotide-binding site-coding resistant gene, PR10, cinnamic acid, benzyl alcohol acetyltransferase(BEAT), RNA-Seq 등