[인터뷰]우상욱 팜캐드 대표 "제2 구글 노린다…단백질 구조예측 올림픽 참가"
팜캐드, 국내 기업 최초로 CASP14 참가
질병 원인 밝혀내고 치료 방법 찾는다
【서울=뉴시스】우상욱 팜캐드 대표
CASP는 지난 1994년부터 2년마다 열리는 글로벌 단백질 구조예측 대회다. 전 세계의 단백질 구조 연구 과학자들이 전문 지식과 방법론을 겨룬다. 국내에서는 서울대 화학과 석차옥 교수 연구팀과 KAIST의 고등과학원(KIAS) 연구팀이 과거 대회에 참여해 의미있는 성적을 냈다.
대회가 주목받은 건 2018년 구글이 참여하기 시작하면서부터다. 알파고 프로그램으로 이세돌 9단을 이긴 구글의 인공지능 전문 자회사 딥마인드(DeepMind)가 단백질 구조예측 프로그램 ‘알파폴드’(AlphaFold)로 처녀 출전했다. 월등한 성적으로 우승을 차지하며 단백질 구조예측 분야에 본격적으로 뛰어들었다. 알파폴드는 수천개의 단백질 데이터를 학습시켜 그 구조를 예측하게 하는 딥러닝 알고리즘 GAN을 사용했다.
팜캐드의 단백질 구조예측팀을 이끌고 있는 우상욱(부경대 물리학과 교수) 대표를 만나 CASP14 대회와 단백질 구조 예측의 의미에 대해 얘기를 나눴다.
-단백질 구조 예측이 무엇인가.
"단백질을 이루는 기본단위인 아미노산의 서열을 1차구조라 부른다. 이 서열로부터 만들어지는 알파 나선구조(alpha helix)와 베타 병풍구조(beta sheet)를 2차구조로 부른다. 이 2차 구조가 물리·화학적 힘에 의해 특정한 모양으로 접히게 되는 것을 3차구조라고 한다. 간단히 말하면 아미노산 서열(1차원 구조)로부터 3차원적인 접힌 모양을 풀어내는 과정이다."
-단백질 구조 예측이 바이오 산업에서 왜 중요한가.
"인간은 약 2만500개의 유전자를 갖고 있다. 생물학자들은 인체 내 세포의 종류에 따라 수만~수십만개의 단백질이 만들어 진다고 예측하고 있다. 각 단백질이 고유의 정해진 3차구조를 정확히 만들어야 그 기능을 정확히 수행한다. 유전자 돌연변이나 기타 생물학적·화학적·환경적 요인에 의해 그 구조가 부정확하게 접히게 되면 알츠하이머 치매, 광우병, 암과 같은 질병에 걸릴 수 있다. 즉, 단백질의 정확한 구조를 아는 것은 질병의 원인을 밝혀내고 치료 방법을 찾아내는데 중요한 역할을 한다."
-팜캐드의 AI 기반 파뮬레이터 기술은 기존의 단백질 구조예측 기술과 어떻게 다른가.
"엑스레이 이용 분석방법(X-ray diffraction·XRD)은 단백질 결정 샘플을 준비하는 과정이 매우 어렵고 오래 걸린다. 최근 각광받고 있는 Cryo-EM이라는 첨단 방법도 아직은 해상도가 미흡한 편이다. 팜캐드에선 AI 기반의 알고리즘 방법인 LSTM/GAN 등을 이용하고 분자동역학 시뮬레이션을 이용해 비교적 짧은 시간 안에 실제 생리적 환경 내에서의 단백질 3차구조를 예측한다. AI 기술을 이용한 단백질 3차구조 예측은 구글을 제외하면 기업 수준에선 아직 초기 개발 단계다. 특히 구글 딥마인드가 지난 대회에서 사용한 AI 방법이 분자들의 상호거리를 학습 데이터로 사용했는데, 팜캐드의 기술은 각도를 중심으로 하는 우리만의 독특한 방법이다."
-대회는 어떻게 진행나.
"CASP가 진행되는 약 4개월 간 조직위원회는 매일 2~3개씩 3차원 구조가 공개되지 않은 단백질 구조 관련 문제를 출제한다. 현재 186개 전문가 그룹과 84개 예측 서버가 총 140개 문제를 풀고 있다. 팜캐드는 총 7개 세부항목 중 3차원 구조예측 분야와 구조정밀화 분야에 출전했다. 11월에 좋은 예측 성적을 올린 팀들과 가장 인상적인 예측방법을 개발한 팀을 선별해 발표한다. 12월 중 유럽에서 CASP14 학술회의를 개최할 예정이다."
-어떤 성적을 낼 것으로 기대하나.
"아직 예측하기 어렵지만 이미 답이 알려진 몇 개의 문제에서 구조를 비교해 보면 우리가 만들어낸 예측 값이 정답과 상당히 근접해 있다고 보인다. 좋은 성적을 기대하고 있다. 팜캐드의 기술이 학계에서 인정받고, 글로벌 기업으로 한걸음 내딛는 기회가 되길 바란다."
-팜캐드는 어떤 회사인가.
"부경대학교와 미국 대학 연구소에서 수행한 20여년 연구를 바탕으로 작년 3월 설립한 인공지능 기술 기반 신약개발 바이오 벤처다. 현재 부산 R&D센터와 서울 사업소에 46명의 임직원이 근무하고 있다. 12명의 박사급 연구원이 신약개발과 단백질 구조예측분야에서 연구 중이다. 개발 중인 ‘파뮬레이터’ 플랫폼 기술은 단백질 3차원 구조 예측 기능, 자동화된 분자 동역학 시뮬레이션 기능, 네트워크 이론을 적용해 저분자 약물후보 물질의 독성을 예측하는 기능을 가진다. 오는 19~20일 서울 용산드래곤시티에서 개최되는 대한민국 바이오 투자 컨퍼런스에서 팜캐드의 기술과 현재 개발 중인 파이프라인을 소개할 예정이다."
◎공감언론 뉴시스 [email protected]
Copyright © NEWSIS.COM, 무단 전재 및 재배포 금지