3억 개 데이터 학습한 ‘DeepRM’
유전자 조절 기전 세계 최초 규명
RNA 변형 위치·정도 ‘정밀 측정’
유전자 조절 기전 세계 최초 규명
RNA 변형 위치·정도 ‘정밀 측정’
DeepRM과 기존 RNA 변형 검출 기술 간 정확도 비교. DeepRM은 기존 기술 대비 월등히 높은 세계 최고의 RNA 변형 검출 및 정량 정확도를 보인다. 기존의 최고 정확도 기술인 Dorado와 DeepRM의 검출 성능을 정밀도-재현율 곡선을 이용해 비교하였다(왼쪽). RNA 변형의 변형 정도 역시 Dorado에 비해 매우 높은 정확도를 보인다(오른쪽). 한국연구재단 |
개별 RNA 분자 수준에서 유전자 발현을 조절하는 RNA 변형을 정밀하게 분석할 수 있는 인공지능(AI) 기술이 나왔다.
한국연구재단은 서울대 백대현 교수팀이 AI와 단분자 시퀀싱 기술을 결합해 RNA 변형을 단분자 해상도에서 높은 정확도로 검출하는 원천기술을 개발했다고 19일 밝혔다.
RNA 변형은 RNA 기본 구성단위인 뉴클레오타이드가 화학적으로 변화한 형태다.
이는 유전자 발현과 암 발생 등 다양한 생명현상에서 중요한 역할을 하는 핵심 조절자지만, 지금까지 개별 RNA 분자 수준에서 변형을 정확하게 측정할 기술이 없어 생물학적 기능을 규명하는 데 한계가 있었다.
연구팀은 RNA 변형 위치와 변형 정도를 정확히 측정할 수 있는 AI 기반 '딥알엠(DeepRM)'을 개발했다.
RNA 분자 하나를 채널 단백질에 통과시킬 때 발생하는 전류 신호를 분석해 서열을 결정하는데, DeepRM은 이 미세한 전류 신호를 AI로 해독해 개별 RNA 분자 내 변형을 정확하게 검출한다.
연구팀은 DeepRM 모델 학습을 위해 교수팀은 무작위 서열 내에 RNA 변형이 포함된 약 3억 개의 RNA 분자를 화학적으로 합성했다.
이는 기존 학습 데이터셋보다 1000배 이상 큰 규모로, 실제 인간 RNA와 유사한 특성을 지닌다.
기존 RNA 변형 검출 기술과 DeepRM의 비교. DeepRM은 기존 RNA 변형 검출 기술의 한계를 극복한 혁신적 방법론을 사용해 세계 최고의 정확도를 달성하였다. DeepRM 학습 데이터셋은 정해진 위치에 일반 염기 또는 RNA 변형을 포함하도록 합성하였기에, 기존 학습 데이터셋과 달리 개별 RNA 변형의 전류 신호가 명확히 분리된다. 또 3억 개 이상의 RNA 분자를 시퀀싱하여, RNA 변형 주변의 가능한 모든 서열을 포함한다. 이러한 대규모·고품질 데이터셋을 이용해 트랜스포머 기반의 DeepRM 모델을 학습시켰다. 학습된 DeepRM 모델은 비전형적 RNA 변형 위치까지 검출할 수 있으며 완벽에 가까운 검출 정확도를 보인다. 한국연구재단 |
연구팀은 단순한 통계 수치 대신 생성되는 전류 신호 전체를 그대로 처리하는 대형 트랜스포머 기반 모델을 설계해 완벽에 가까운 검출 정확도를 달성했다.
연구결과 DeepRM은 기존 세계 최고 정확도 모델인 도라도(Dorado) 성능을 크게 상회했다.
연구팀은 이 기술을 활용해 인간 RNA에서 10만 개 이상의 RNA 변형을 발견했고, 특히 기존 기술로 찾기 어려웠던 비전형적 위치의 변형을 1만 개 이상 찾아냈다.
이런 방대한 데이터는 향후 RNA 변형의 의학적 기전을 규명하는 핵심 기초 자료로 활용될 전망이다.
또 DeepRM의 단분자 해상도를 활용해 RNA 생산 과정인 '스플라이싱(splicing)'과 특정 위치 RNA 변형이 연관되어 있다는 사실도 세계 최초로 규명했다.
스플라이싱은 전사된 pre-mRNA에서 불필요한 인트론을 제거하고 필요한 엑손을 연결해 성숙 mRNA를 만드는 과정이다.
이번 연구는 그간 베일에 싸여 있던 유전자 발현 조절 기전을 심층적으로 연구할 수 있는 새로운 전기를 마련했다.
백 교수는 “DeepRM은 다양한 생명과학·의생명 분야에서 RNA 변형의 기능을 연구하는 핵심 기술로 활용될 것”이라며 “후속 연구로 여러 종류의 RNA 변형을 동시에 검출하는 기술로 확장해 질병 특이적 바이오마커 발굴과 RNA 기반 치료 전략 개발로 이어가겠다”고 말했다.
한편, 이번 연구성과는 지난달 국제학술지 ‘네이처 커뮤니케이션즈(Nature Communications)’에 게재됐다.
(논문명 : Comprehensive discovery of m6A sites in the human transcriptome at single-molecule resolution / 저자 백대현 교수(교신저자/서울대학교), 강기현 박사과정(제1저자/서울대학교), 황현서 박사과정(제1저자/서울대학교), 전현성 박사(제1저자/서울대학교), 최희진 박사과정 (제1저자/서울대학교), 장희령 박사(제1저자/서울대학교), 여나경 박사과정 (제1저자/서울대학교) 외 10명)
