<이미지를 클릭하시면 크게 보실 수 있습니다> |
단백질 인공지능(AI) 설계 분야 대가인 데이비드 베이커 미국 워싱턴대 교수가 새로운 단백질 분석 AI '로제타폴드 올 아톰(RoseTTAFold All-Atom)'을 공개했다. 베이커 교수가 30년 가까이 개발 중인 단백질 분석·예측·설계 프로그램 시리즈인 '로제타'의 최신작이다. 로제타폴드 올 아톰은 단백질과 DNA, RNA 등 모든 생체 분자를 모델링하고 설계할 수 있는 심층 분석 AI다. 베이커 교수팀은 "단순한 단백질 아미노산 분석을 넘어 완전한 생물학적 구성 요소를 모델링할 수 있다"며 "흑백TV를 보다가 컬러TV로 전환되는 것과 비슷한 수준의 분자생물학적 혁신"이라고 소개했다. 이번 연구는 생명에 대한 이해도를 높이고 뛰어난 기능을 갖춘 새로운 단백질의 설계를 가능케 할 것으로 기대된다.
8일(현지시간) 베이커 교수팀은 "더 많은 생명체 분자를 모델링하는 로제타폴드 올 아톰을 개발했다"는 연구 결과를 국제학술지 '사이언스'에 공개했다. 단백질은 모든 생명 현상에 관여하는 생체 분자다. 20종의 아미노산이 복잡한 사슬 구조로 연결됐다. 사슬이 꼬이고 얽히며 접히는 현상이 일어나고 복잡한 입체 구조를 형성한다. 구조에 따라 특성과 기능이 다양하다. 단백질 분석이 생명과학 연구와 신약 개발에 획기적 전기가 될 수 있다는 평가가 나오는 이유다.
로제타폴드 올 아톰은 단백질 분석을 넘어 단백질과 다른 비단백질 화합물 간 상호작용까지 분석한다. 단백질은 스스로 기능하는 경우가 없다. 다른 비단백질 화합물과 상호작용하며 기능한다. 예를 들어 분자생물학에서 분자량이 매우 적은 유기화합물을 뜻하는 소분자와 단백질 간 상호작용은 약의 효능을 결정짓는다. 질병의 원인이 되는 표적 단백질에 치료제 성분의 소분자가 잘 결합하는지에 따라 효능이 갈린다.
그러나 단백질과 소분자 간 상호작용을 분석하는 일은 난제다. 소분자에 결합하는 단백질을 구별해내는 것부터 어렵다. 그간 표지를 단 소분자가 표적 단백질에 결합하는 친화력을 확인하는 고전적 방식으로 소분자에 결합하는 단백질을 구별해왔다. 그러나 이 방법은 소분자와 단백질 간 친화력이 클 때만 사용이 가능하다. 연구팀은 "로제타폴드 올 아톰을 사용하면 단백질에 소분자가 결합하며 단백질이 접히는 단백질·소분자 도킹 현상까지 알아낼 수 있다"면서 "단백질과 소분자 간 상호작용에 대한 포괄적 이해를 넓혀주는 것으로 로제타폴드 올 아톰의 핵심 메커니즘은 바로 단백질을 넘어 다른 생체 분자들까지 분석하는 것"이라고 강조했다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
과학계와 바이오업계에서는 이번 연구 결과를 환호 중이다. 연구는 논문 사전 검증 사이트 '바이오아카이브'를 통해 지난해 11월 선공개돼 연구자들이 미리 연구를 접한 바 있다. 지리 담보스키 체코 마사리크대 교수는 "분자생물학의 게임 체인저가 될 것"이라고 밝혔다. 미국 바이오 기업 '미네바이오'의 데이비드 리앙 최고경영자(CEO)는 "로제타폴드 올 아톰의 모델링 및 설계 기능이 매우 뛰어난 것으로 보인다"고 말했다.
이런 반응을 보이는 것은 로제타폴드 올 아톰이 생물학 분야에서 기본 AI 모델로 자리 잡을 가능성 때문이다. 신약 개발을 넘어 인공 광합성 연구도 가능하다. 광합성 역시 단백질이 기능한다. 베이커 교수팀은 실제 인공 광합성 시스템 연구도 진행 중이다. 그 외에도 탄소중립, 플라스틱 분해 촉매제 등 다양한 분야에 단백질 분석 기술이 활용될 가능성이 제시된다. 베이커 교수의 제자이자 이번 연구 저자로 참여한 백민경 서울대 생명과학부 교수는 "단백질 분석에 대한 인류 역사에 최근 정점을 찍고 있다"고 말했다.
로제타폴드 올 아톰은 30년 가까이 단백질 연구에 매진해온 베이커 교수팀 노력의 산물이다. 베이커 교수는 1990년대 후반 단백질 연구에 돌입했다. 당시에 아무도 연구하지 않았던 단백질 구조를 '예측'하는 것에 도전했다. 베이커 교수는 "박사후연구원 때 아미노산을 하나하나 분석해가며 단백질 구조를 파악하는데 머리가 너무 아프고 나와 맞지 않는다고 생각했다"면서 "뭔가 다른 것을 시작해보고 싶었고 구조 자체를 예측하는 것으로 연구 주제를 잡았다"고 말했다.
그렇게 해서 등장한 것이 단백질 구조 예측 프로젝트 '로제타'다. 로제타는 기원전 196년에 고대 이집트에서 제작된 석비인 로제타스톤에서 이름을 따왔다. 로제타스톤에는 고대 이집트어로 된 법령 등이 쓰여 있는데, 이 때문에 고대 이집트 문학과 문명을 이해하기 위한 필수적 사료로 여겨진다.
베이커 교수는 로제타 프로젝트에 돌입하자마자 단백질 구조를 예측하는 알고리즘을 만들어냈다. 이 알고리즘을 기반으로 단백질 분석 모델 시리즈를 출시해왔다. 여러 시리즈 중에 가장 주목받은 것이 2021년 등장한 단백질의 접힘을 예측하는 '로제타폴드'다. 단백질이 사람 몸속에서 자신만의 입체 구조를 형성하는 일련의 과정이 단백질 접힘이다. 잘못 접힌 단백질 구조 때문에 알츠하이머 치매나 파킨슨병 같은 뇌질환이 나타나는 것으로 알려졌다. 로제타폴드는 짧게는 수분, 길어야 몇 시간 안에 단백질 접힘 구조를 정확하게 밝혀낸다.
로제타폴드는 세 종류의 AI로 구성된다. 미지의 단백질이 주어지면 단백질 데이터베이스에서 비슷한 아미노산 서열을 찾는 AI와 단백질 내부에서 아미노산들이 연결되는 형태를 예측하는 AI, 입체 구조를 제시하는 AI가 협력한다. 이 과정을 반복하며 각 AI가 제시한 결과를 개선해 정확도를 높인다. 이 연구는 사이언스가 꼽은 2021년 최고의 혁신적 연구 성과에 선정됐다.
로제타 시리즈는 단백질 예측을 넘어 설계로도 확장됐다. 베이커 교수팀은 2022년 '로제타폴드 디퓨전'을 공개했다. 로제타폴드 디퓨전은 사용자가 단백질의 모양과 크기, 기능과 같은 속성을 설명하면 이에 부합하는 새로운 단백질 디자인을 생성해 제시하는 모델이다. 챗GPT 같은 생성형 AI에 키워드를 입력하면 AI가 이에 맞는 그림을 그리는 것과 같은 원리다. 단백질을 설계하는 데 소요되는 시간은 4~6주다.
로제타 시리즈는 연구 결과를 공개해 상호 검증하면서 집단적으로 보편 지식을 생산해내는 개념을 뜻하는 '오픈 사이언스'의 대표 사례로 평가받는다. 연구자 등 비상업적 사용자는 무료로, 제약사 등 사용자는 유료로 이용하게끔 한다. '로제타커먼스'란 네트워크를 만들어 사용을 돕고 있다. 집단 지성의 힘도 빌렸다. '로제타앳홈(Rosetta@home)'이란 플랫폼을 만들었다. 로제타앳홈은 일반 참가자의 컴퓨터 유휴 자원을 모아 단백질 구조를 분석하는 플랫폼으로 2020년 기준 5만5000대에 달하는 컴퓨터가 단백질 분석을 돕고 있다.
단백질 분석은 신약 개발의 새 지평을 열 것으로 기대되며 제약바이오 업계에서 특히 각광받고 있다. 코로나19 팬데믹(세계적 대유행) 사태 때 치료제나 백신 후보물질 발굴에 쓰이는 등 실제로 활용되고 있다. 베이커 교수팀은 미래에 단백질을 일종의 '도구'로 쓸 수 있을 것으로 기대한다. 그는 "우리는 이전에 결코 할 수 없었던 방식으로 단백질을 이용해 무언가를 만들 수 있을 것"이라며 "예를 들어 새로운 유형의 약물·백신·치료제, 심지어 재료까지 제조할 수 있을 것"이라고 밝혔다.
[고재원 기자]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.