From PGI
질문1. 생물정보학 전문가가 되신 이유나 계기가 있다면?
University of Iowa에서 전산학 박사 학위과정에 있을 때 이론적인 주제로 연구하다가 실용적인 분야로 변경하여 대규모 최적화 문제를 새로운 주제로 찾는 중, 우연히 genome assembly 문제가 생물학 지식이 많지 않아도 전산학 박사 주제로 다룰 수 있는 실용적인 문제라는 것을 알게 되었습니다. 이에 지도교수와 같이 1995년부터 genome assembly 연구를 시작한 것이 계기가 되어 생물정보학 연구를 시작하게 되었습니다. 1997년 졸업 후 University of Illinois at Urbana Champaign에서 Bioinformatics Unit Director로 재직하면서 초보 생물정보학자가 되었습니다. 1998년에 미국 DuPont 회사가 화학에서 Life Sciences로 변환한다는 매우 야심 찬 계획을 추진하는 과정에서, 저는 1998년 DuPont 중앙 연구소 선임연구원이 되어 생물학자들과 일할 기회를 갖게 되면서 전산학자에서 생물정보연구자로 전환하였습니다. 2001년 미국 Indiana University로 이직하여 Bioinformatics 대학원 학위 과정을 만들면서 드디어 생물정보 전문가가 된 것 같습니다.
제가 생물정보를 시작할 당시에는 학문이 형성되는 매우 초기단계라 거의 독학을 해서 전문가가 되는 데까지 시간이 많이 걸렸네요. 이 인터뷰를 통해 생물정보를 하시고 싶은 분들에게 생물정보를 배우는데는 시간이 많이 걸린다는 점을 강조하고 싶습니다. 많은 분들이 조금 시도해 보고는 여러 가지 이유로 포기하는 경우가 미국에서도 한국에서도 너무 많아 안타깝습니다. 생물정보는 매우 광범위하기 때문에 꾸준히 노력하면 많은 분들께서 성공하실 수 있습니다. 다행히 이제는 생물정보를 체계적으로 배울 수 있는 학위 과정이 개설되어 있는 학교들이 있고, 또한 우리나라에서 2012년 11월부터 BIT 융합 생물정보 교육프로그램이 시작되어 더 많은 교육 기회가 제공될 것으로 기대합니다. 많은 분들이 “포기하지 말고 꾸준히” 노력하여 더 많은 생물정보 전문가가 생기길 바랍니다.
질문2. 암과 같은 질병 연구에 있어, 후성유전체학은 어떻게 적용될 수 있을까요?
유전체 변이가 여러 암과 관련이 있다는 수많은 연구가 있고, 이 정보는 이미 다수의 데이터 베이스에서 가공해서 제공되고 있습니다. (예, Sanger Center에서 COSMIC, Catalogue Of Somatic mutations in Cancer). 하지만 유전체 변이만으로는 암과 같은 복잡한 질병을 이해할 수 없습니다. 예를 들어 GWAS 연구는 수많은 연구가 진행되어 아주 유용한 정보가 축적되었지만 (예, dbSNP, COSMIC 등), 유전자 변이와 질병과의 연관 관계를 아직 밝히지는 못하고 있습니다. 간단한 예로 많은 암 세포에서 측정되는 유전자 변이가 암의 원인이 아니라, 암이 생겨서 만들어진 결과 (암이 진행되면서 DNA repair 기작 등이 오작동해서)일 가능성이 많습니다. 암 환자의 정상 세포에서 측정되는 어떤 유전체 변이가 암으로 발전하는 원인이 되는지는 궁극적으로 후성유전체 정보와 포괄적으로 이해되어야 합니다. 또 다른 예로, 이미 다수의 암이 박테리아나 바이러스 때문에 생기는 것으로 알려져 있습니다 (예, 위암, 자궁 경부암). 아마도 이러한 암의 발생은 박테리아나 바이러스에 의한 지속적인 자극이 원인일 가능성이 높은데, 이는 직접적인 유전체 변이보다는 후성유전체 변이가 이유일 가능성이 높습니다. 따라서 유전체와 후성유전체를 종합적으로 분석해야만 셀 고유의 병과 관련된 네트워크 바이오마커를 발굴하고 이 정보를 이용해 우리가 암과 같은 복잡한 질병을 이해할 수 있습니다.
미국, 유럽에서는 유전체와 후성유전체를 종합적으로 측정해서 특정 표현형질과 관련된 셀 고유의 네트워크를 이해하려는 많은 연구(TCGA, 1000 genome projects, ENCODE, modENCODE 등)가 진행되고 있습니다. 실제로 최근에 발표되고 있는 TCGA 논문 등을 보면 이러한 종합적인 연구가 훨씬 설득력 있는 결과를 보여줌을 알 수 있습니다. 하지만 이러한 종합적인 연구는 매우 많은 경우의 유전체, 후성유전체 인자들과의 복잡한 관계를 데이터 마이닝에 필요로 하는데, 불행히도 전세계적으로 잘 훈련된 생물정보연구자들이 매우 부족하여 유전체, 후성유전체 데이터를 이용한 연구를 진행하는데 많은 어려움이 있습니다.
질문3. 생명정보학에 있어 빅데이터의 정의는 어떻게 할 수 있으며, 이를 처리하기 위해 가장 필요한 것은 무엇이 있을까요?
생명정보학 측면에서 보면, 바이오 빅 데이터는 유전체, 후성유전체, 단백질 등을 측정한 데이터 이지요 (이러한 데이터를 처리 해보면 왜 “빅 데이터”인지는 설명이 필요없을 겁니다). 저는 원래 전산학 배경으로 생물정보를 하기 때문에 개인적으로 생물정보학이란 “생물정보를 이용한 데이터 마이닝”이라고 정의하고 있습니다. 최근 차세대 (이미 3세대) 시퀀싱 기술의 발달로 이미 생물정보는 아마 가장 수요가 큰 빅 데이터라고 할 수 있습니다. 그런데 이러한 빅 데이터를 이용하여 유전체, 후성유전체 인자들의 관계를 연구하려면, 이는 기본적으로 빅 데이터 데이터 마이닝이라고 할 수 있습니다.
빅 데이터 처리를 위해서 너무나 많은 것이 필요한데, 간단히 3가지로 나열하면 다음과 같습니다. 첫번째 문제는 현재 컴퓨터 기술은 바이오 빅 데이터를 처리 분석하는데 많은 구조적 문제가 있습니다. 하드웨어 측면에서는 현재 컴퓨터 구조는 I/O overhead가 심해서 데이터 처리/분석이 매우 어렵습니다. 소프트웨어 측면에서는 바이오 빅 데이터 저장만 해도 현재의 RDBMS는 거의 사용이 불가능합니다. 두번째 문제는 현재 기계학습이나 데이터 마이닝 기법의 기술 수준이 “생물정보를 이용한 데이터 마이닝”을 하기에는 매우 부족합니다. 가장 간단한 예로 scalability 문제를 들 수 있는데 많은 기계학습 알고리즘들이 omics data (세포 전체 정보)가 입력되면 작동되지 않습니다. 세번째 문제는 제일 중요한 데이터 마이닝을 할 생물정보 전문가의 부재입니다. 데이터 마이닝은 특정 분야의 전문 지식과 데이터 마이닝 능력이 겸비되어야 하는데, 이러한 인력은 전 세계적으로 매우 부족합니다. 따라서 최근에는 “백만원 인간 게놈 정보 생산, 10억원 분석 비용” 이라는 말까지 나오고 있습니다. 많은 대학에서 인력 양성에 힘을 써야 하고, 정부의 적극적 지원도 필요합니다. (우리나라에 국한된 문제가 아니라 전 세계적인 문제입니다.)
질문4. 게놈학 분야가 연구 수준을 넘어, 산업화 하기 위해서 가장 필요한 것을 꼽는다면, 어떤 것이 있을까요?
글쎄요. 같은 이야기를 반복하게 되는데 좋은 생물정보 전문가가 많이 생기면 게놈학도 비약적 발전을 하게 되고 자연스럽게 산업화가 되지 않을까요? 물론 시간이 가면서 특정 타겟을 정해서 연구를 집중해야 할 텐데, 노령 사회에 관련된 질병 예방/치료 등이 중요하겠지요.
질문5. 개인이 PC를 소유하게 됨으로써, 온라인 커뮤니티와 같은 새로운 형태의 문화가 나타났는데요. 개인이 자신의 유전정보를 소유하게 되는 시대에는 어떤 새로운 문화가 나타날까요?
많은 사람의 유전체, 후성유전체 정보가 측정되면 자연스럽게 맞춤의학 시대가 열리지 않을까요? 특정 약이 왜 사람마다 효능이 차이가 나는지가 설명되는 경우가 많아질 테니까요. 질병뿐만 아니라, 작물, 가축 등 우리 음식과 관련된 혁명도 자연스럽게 일어나겠지요. 보험, 인력 채용에도 사용될 수 있겠지만 정보 보안, 윤리등이 매우 심각한 문제가 되어 우리가 기다리는 미래는 예측이 불가능 할 것 같습니다.
질문6. 개인 유전정보 시대에는 병의 진단을 위한 특정 유전자에 대한 정보가 매우 중요한데요. 이런 질병을 진단할 수 있는, 유전자에 대한 특허권에 대해 어떻게 생각하시나요?
개인적으로는 유전자 특허권은 타당하지 않다고 생각합니다. 우리가 유전자 자체를 만든 것이 아니니까요. 하지만 네트워크 바이오마커 등의 연구를 통해 질병과의 관계를 규명하고 이를 치료에 적용하는 경우 특허권은 가능하다고 생각합니다. 특허를 찬성하는 의견에도 일리는 있지만, 아직 생명정보가 실용화되려면 기술이 비약적으로 발전해야 합니다. 초기 단계에서 특허권은 산업발전 자체를 막기 때문에 특허의 허용은 기술이 좀 더 발전될 때까지 기다려야 모두에게 좋은 기회가 올 것으로 생각합니다.