From PGI
쌍봉낙타와 단봉낙타의 종간 비교를 통한 개체 수 돌연변이 비율 추정
극한 환경에서도 생존 능력이 뛰어난 야생 쌍봉낙타(Camelus bactrianus)는 현재 야생 개채수 900마리 미만으로 심각한 멸종 위기에 있다. 3~6천년 전 길들어져 교통, 우유, 양모, 고기 생산 등 다목적으로 쓰이고 있으며, 순화(방목)으로 인해 그룹화 개체에서 떨어져 서식하게 되었고, 사막화 증가에 따른 인간의 영양을 위한 지속적 수요를 위해 경제적 가치가 증가하게 되었다. 마침내 야생낙타는 강한 인위적 선택으로 표현형과 품종이 다양해지고 가축으로 길러지게 되었다.
가축의 표현형 변이와 유전 기초를 이해시키는 고유한 자원 데이터를 생성하기 위해, NGS 기술과 플랫폼으로 가축 및 야생 종의 발달된 전장 게놈을 분석하여 야생종에서 가축으로 변환되는 동안의 변이를 식별하였다. 이는 닭, 개, 돼지, 양에서도 이루어지고 있는 연구이며, 최근 DDBJ / EMBL / GenBank 프로젝트에서 야생낙타(Camelus ferus)의 염기서열 연구가 이루어지고 있으나, 아직 쌍봉낙타와 단봉낙타에 대한 데이터는 전무한 상태였다.
국내 동물 육종을 위한 게놈 분석에서 가장 중요한 핵심은 고밀도 SNP(single nucleotide polymorphism) 지도를 작성하는 것이다. 특히 Biallelic 마커는 게놈 전체에 분산되어 있어서 인간에서 발생되는 질병과 유사하게 발견된다. 실제로 국내 동물들에서 GWAS(genome wide association study) 연구로 돼지, 소, 닭의 SNP 특성이 확인되었고, 특정 선호 표현형과 관련된 유전자형을 확인할 수 있었다. 특정 종의 순화, 번식, 유전적 분화 등 진화에서 SNP 데이터를 이용하면, 선택적 번식을 위한 새로운 방법과 마커를 이용한 형질을 개발할 수 있을 것이다.
이미 2012년 중국의 과학자들이 쌍봉낙타의 유전자 염기서열을 분석하여 생존력의 단서를 포착하였으며, DNA를 분석하여 20,821개 유전자 중 대부분이 거친 사막의 식물을 먹이로 삼고, 먹이나 물이 없이도 며칠씩 견딜 수 있는 대사 메커니즘과 연관있음을 확인하였다.
이번 연구는 오스트리아 für Populationsgenetik 연구소에서 쌍봉낙타(Camelus bactrianus)와 단봉낙타(Camelus dromedarius) 중 수컷 쌍봉낙타 1마리의 전장게놈을 샷건시퀀싱하고, de novo 어셈블리를 통해 약 1.6Gb의 사이즈를 확인하였다. 또한 hetero SNP를 식별하여 개별 낙타에 따른 염기 다양성을 추정하였고, 유사한 시기에 가축으로 길들여진 유제류(포유류 중 발 끝에 발굽이 있는 동물)와 116,000개 SNP가 비슷하게 형성된 것을 확인하였다. 이는 경제적으로 중요한 순화 및 환경 적응과정 등의 형질 변이를 식별하기 위한 GWAS 연구에 기초자료로 이용될 수 있을 것이다.
Hetero SNP 식별을 위해 오스트리아 동물원에서 수컷 쌍봉낙타 1마리에서 게놈을 혈액 및 조직에서 추출하였다. 일루미나 시퀀싱 라이브러리를 제작하였고, Genome analyzer IIx로 paired end sequencing을 수행하여 20Gb를 생산하였다. 레퍼런스가 없기 때문에 CLC annotation cell 4.0.1beta로 de novo assembly 생성하였으며, Paired end 정보를 이용하여 인접 시퀀스를 조합하였고, BWA 0.5.7은 참조용으로 이용하여 정렬하였다. 낮은 퀄리티의 서열은 PoPoolation software, FastQC로 인해 제거되었다. Hetero SNP 식별은 SAMtools 0.1.14와 BCFtools로 수행되었으며, 반복되는 염기서열에서 잘못된 SNP를 제거하기 위해 BEDTools 2.15.0를 사용하였다. 또한 진정한 다형성과 시퀀싱 오류를 구별하기 위해 Clopper-Pearson 방법을 이용하여 SNP 95% 신뢰구간을 계산하여 벗어난 것 제거하고, 범위 내 유전적 다양성을 결정하기 위해 돌연변이 비율(θ=4Neμ; Ne는 개체그룹 크기, μ는 염기 당 세대 당 돌연변이) 계산하였다.
맺음말
쌍봉낙타의 어셈블리 결과는 GC 비율이 39.6%, 781462 contig로 구성되어 있었으며, 어셈블리 50%가 길이가 긴 contig로 구성되어 있는 특징을 보였다. 포유류 게놈의 높은 빈도의 반복서열을 고려하여, 비례한 인접 매핑을 확인하고, 유전자 중복 및 CNV(Copy number variant)를 고려하여 SNP 감지를 15 depth이상으로 기준하여 유제류와 데이터를 비교하였다.
유제류 중 황소의 레퍼런스 게놈(bosTau 4.0)과 비교하였을 때 유사한 SNP 수를 나타났지만, 쌍봉낙타와 단봉 낙타의 hetero SNP는 비교적 낮은 수가 감지되었다. 그 원인은 랜덤하지 않은 짝짓기 집단에서 근친 교배로 인해, 염기 다양성이 유제류를 비롯한 가축에서 높은데, 그 수준이 돼지와 유사하였다. 본 연구는 쌍봉낙타와 단봉낙타 사이의 첫번째 비교게놈 서열을 제시하였으며, GWAS 연구에서 표현형과 유전자형을 정의하여 비교하는 연구를 위한 데이터를 제공하는데 가치가 있었다. 뿐만 아니라, 게놈 다양성에서 비정상적으로 높거나 낮은 지역을 찾아, 낙타의 야생방목의 과정에서 선택적 진화 연구가 가능할 것이다.
낙타의 이전 연구는 EST, nanobody, 당뇨병 치료에 낙타 우유 사용, 면역 글로불린 응용 등이 있었으며, 이는 경제적 가치뿐만 아니라 인간의학 등 낙타의 특정 생물학적 특성 연구에 이용할 수 있다. 선택적 번식에 중요한 형질의 근간이 되는 유전적 기초를 이해하는 것이 중요한데, 기후 변화로 인해 사막화가 되고 있는 지금, 뜨거운 환경에 대한 적응 유전자를 보유한 낙타의 연구는 필요하다. 쌍봉낙타의 선도 게놈을 조립하여 단봉낙타와 비교하고, hetero SNP를 바탕으로 염기 다양성을 이용할 수 있을 것이다.
참고문헌
Estimating the Population Mutation Rate from a de novo Assembled Bactrian Camel Genome and Cross-Species Comparison with Dromedary ESTs
역저자
글 : Park.HyeonJi
편집 : Ahn.Kung
키워드 : 쌍봉낙타(Camelus bactrianus), 단봉낙타(Camelus dromedarius), SNP(single nucleotide polymorphism), GWAS(genome wide association study), Hetero SNP 등