컨텐츠 바로가기

11.18 (월)

무료로 풀린 노벨상 기술…신약개발 게임체인저 되나[과학을 읽다]

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

노벨 화학상 알파폴드3, 오픈소스로 공개

아시아경제

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글 딥마인드가 개발한 인공지능(AI) 기반 단백질 구조 예측 모델 ‘알파폴드 3(Alphafold 3)’가 무료로 공개되면서 신약 개발 분야에 새로운 기원을 열 수 있을지 주목받고 있다. 비상업적인 학술적 용도에 한정되지만 노벨 화학상을 받은 기술이 무료로 풀린 만큼 질병 정복을 위한 새로운 길이 열렸다는 기대가 나온다.

구글딥마인드는 최근 ‘알파폴드 3’를 완전하게 공개한다고 발표했다. 이제 과학자들은 알파폴드 3의 소소 코드를 내려받아 자신들의 컴퓨터에 설치해 연구에 활용할 수 있다. 누구라도 학술적인 용도로 알파폴드 AI를 이용해 단백질을 연구할 수 있다는 뜻이다.

지난 5월 발표된 알파폴드 3는 소스 코드를 다운받아 사용할 수 있었던 기존 ‘알파폴드 2’와 달리 구글의 ‘알파폴드 서버’를 통해서만 사용할 수 있었다. 단백질의 종류와 수도 제한돼 새로운 단백질 조합 실험이나 데이터 입력을 하는 데 한계가 있었다. 구글은 알파폴드의 핵심인 모델 가중치도 공개하지 않았다. 가중치는 알파폴드 모델의 각 부분에 대한 정보를 담고 있다. 일각에서는 구글 측이 자신들과 연관된 연구에 독점적으로 알파폴드 3를 사용하기 위해 제한을 한 것이라는 추측이 나왔다. 이에 완전 공개를 요구하는 목소리가 터져나왔다.

이번 무료 공개는 비영리 학술 연구를 위해 이뤄졌다. 하지만 상업적 활용이 가능할지 여부에 대해서도 학계와 제약 업계의 관심이 집중되고 있다.

데미스 허사비스 구글딥마인드 최고경영자와 함께 노벨 화학상을 받은 존 점퍼 연구원은 과학전문지 네이처에 "사람들이 이걸로 무엇을 할지 매우 기대된다"고 말했다.

생명체의 기반이 되는 단백질 구조는 신약 개발의 중요한 기초 데이터이지만 기존에는 단백질의 3차원 구조를 실험적으로 밝혀내는 데 긴 시간과 비용이 소요됐다. 구글딥마인드는 AI를 통해 단백질 구조를 예측할 수 있도록 하는 연구를 해냈고 알파폴드는 1, 2, 3으로 발전해왔다. 특히 알파폴드 3는 이전 버전보다 예측 정확도를 50% 이상 높였고 DNA, RNA 등 다양한 생체 분자의 상호작용까지 예측할 수 있다.

◇무료로 활용… 제약사엔 제한= 알파폴드 3는 계산생물학(computational biology)에 새로운 가능성도 제시했다는 평가다. 신약 개발, 생명공학, 농업 등 다양한 분야에서 활용할 수 있다. 알파폴드 3의 소스 코드는 비상업적 용도로 무료 공개되어 연구자들이 자유롭게 접근할 수 있다. 이는 비영리 학술 연구 목적으로는 누구나 사용할 수 있다는 뜻이다. 단 가중치 모델은 요청 시에만 사용할 수 있다. 우리나라 학자들 또한 이 AI 모델을 통해 단백질 구조와 다양한 생체 분자 상호작용을 연구에 활용할 수 있게 됐다.
아시아경제

<이미지를 클릭하시면 크게 보실 수 있습니다>


학계에서 사용은 가능하지만 상업적 용도로 활용하려는 제약사들은 구글 딥마인드와 별도의 라이선스 계약을 통해 허가받아야 한다. 즉 신약 개발의 과정에서 알파폴드 3를 상업적 목적으로 사용하는 것은 제한된다는 뜻이다. 구글 딥마인드는 상업적 라이선스를 요청하는 기업들에 대해 개별 검토를 진행하고 있는 것으로 알려지고 있다.

생명과학 연구자들은 알파폴드 3가 제공하는 고도의 예측 정확도를 활용해 단백질 연구의 효율성을 크게 향상시킬 수 있게 됐다. 장기간 실험을 통해 확보해야 했던 결과물을 AI를 통해 단기간에 정확하게 확보해 이를 통해 유전 질환, 암, 감염병 등 다양한 질병에 대한 새로운 치료법을 개발하는 연구가 활발해질 것으로 보인다. 특히 신약 개발에 대한 기대가 크다. 신약 개발에는 타깃 단백질의 구조와 상호작용을 정밀하게 이해하는 과정이 필수다. 알파폴드 3는 이런 과정을 혁신적으로 가속할 수 있다. 복잡한 생체 분자의 구조와 결합부위 예측을 고도로 자동화함으로써 기존의 실험적 연구 과정을 보완할 수 있기 때문이다.

신약개발을 지원하는 AI는 또 있다. 구글딥마인드 외에도 여러 기업이 오픈소스 단백질 구조 예측 도구를 공개했다. 중국 검색 기업인 바이두가 헬릭스폴드(Helixfold)를 선보였고 틱톡 개발사인 바이트댄스도 동참했다. 미국의 차이 디스커버리(Chai Discovery)도 경쟁에 뛰어들었다. 알파폴드가 쏘아 올린 공이 경쟁으로 이어지고 있는 셈이다

◇알파폴드도 고성능 GPU가 필요해= 알파폴드 3를 효율적으로 활용하기 위해서는 고성능의 컴퓨팅 장비가 필수적이다. 알파폴드 3는 딥러닝을 기반으로 한 모델이다. 단백질 구조 예측을 위해서는 대규모 데이터와 복잡한 계산이 필요하다. 고성능 장비가 있어야 단백질의 각 원자 좌표를 예측하는 과정에서 빠르고 정확한 결과를 확인할 수 있다. 다수의 단백질과 생체 분자 상호작용을 예측해야 하는 연구 환경에서 고성능 GPU는 필수적이다. 대부분의 AI와 유사하게 역시 알파폴드 3도 GPU의 도움이 필요하다.

알파폴드 2는 일반적인 연구용 GPU나 엔비디아 ‘V100’ 이상의 GPU에서도 실행 가능했으나 알파폴드 3는 V100의 후속인 ‘A100’ 이상의 GPU를 사용해야 원활하게 사용할 수 있다고 알려지고 있다. A100은 현재 국내 슈퍼컴퓨터에 주로 사용되고 있는 GPU 기종이다.

고가의 GPU 자원이 한정된 국내 대학 연구실 상황에서는 무료로 알파폴드 3를 사용할 수 있어도 연구에 제약이 있을 수 있다는 뜻이다. 최근 서울대 바이오인공지능 연구단이 A100보다 신형인 엔비디아 ‘H100’ GPU 56대를 도입해 연구에 속도를 내는 것은 매우 드문 경우다.

백종민 기자 cinqange@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.