(영상=AI2)과학 연구를 위한 새로운 인공지능(AI) 모델이 등장했다. 이 모델은 학술 논문을 검색하고 그 결과를 종합해 출처에 기반한 답변을 제공하는데, 첨단 모델인 'GPT-4o'보다 성능이 뛰어나다는 설명이다.
앨런 AI 연구소(AI2)는 19일(현지시간) 워싱턴대 연구팀과 협업, 최신 검색 시스템과 정교하게 조정된 언어 모델을 결합한 AI 모델 '오픈스칼라-8B(OpenScholar-8B)'를 오픈 소스로 공개했다고 발표했다.
오픈스칼라의 핵심은 4500만개 이상의 오픈 액세스 학술 논문이 저장된 데이터베이스를 활용하는 검색 증강 언어 모델이다.
GPT-4o와 같은 기존 대형언어모델(LLM)이 사전 학습된 지식만을 바탕으로 답변을 생성하는 것과 달리, 오픈스칼라는 관련 논문을 직접 검색하고 연구 결과를 종합해 출처에 근거한 답변을 생성한다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
시스템은 먼저 4500만개의 연구 논문에서 AI를 사용해 관련 구절을 검색하고 순위를 매긴다. 이후 초기 답변을 생성하고, 반복적인 피드백 과정을 통해 이를 개선한 후, 출처를 검증한다. 이 과정을 통해 복잡한 과학적 질문에 대해 정확하고 출처가 뒷받침된 답변을 제공한다.
특히 실제 문헌에 기반한 답변을 생성하는 능력은 오픈스칼라의 주요 차별화 요소로, 최근 과학적 질문에 대한 AI 시스템을 평가하는 새로운 벤치마크인 스칼라QA벤치(ScholarQABench)에서 뛰어난 성과를 보였다.
사실성 및 인용 정확도 부문에서 오픈스칼라는 GPT-4o와 같은 대형 모델들보다 더 나은 결과를 보였다.
예를 들어, GPT-4o는 생의학 연구 질문에서 90% 이상이 존재하지 않는 논문을 인용하는 반면, 오픈스칼라는 인간 전문가 수준으로 검증 가능한 출처를 기반으로 답변을 제공했다. 전문가들은 동료들이 작성한 답변보다 오픈스칼라의 답변을 선호한다고 보고했다.
하지만 오픈 액세스 논문만 포함하고 있으며, 일부 중요한 유료 논문들은 제외됐다. 이는 의학이나 공학 등에서 중요한 연구 결과를 놓칠 가능성이 있다는 것이다.
현재 연구진은 오픈스칼라의 코드, 모델, 데이터, 도구들을 AI2 웹사이트를 통해 공개했다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.