[AI리포터]
[디지털투데이 AI리포터] 인공지능(AI)이 현대적 편향을 배제하고 특정 시대의 관점만 학습하도록 설계된 타임캡슐 LLM(TimeCapsule LLM)이 개발됐다.
14일(현지시간) 온라인 매체 기가진에 따르면, 1800~1875년 데이터를 기반으로 훈련된 이 모델은 당시의 언어와 세계관을 반영하는 데 초점을 맞췄다.
개발자 하이크 그리고리안은 "AI가 역사적 AI처럼 행동한다면 어떤 결과가 나올까?"라는 질문에서 프로젝트를 시작했다고 한다. 초기 버전은 단순한 모델에서 출발했지만, 마이크로소프트의 파이 1.5(Phi 1.5)를 기반으로 한 버전 1에서는 실제 역사적 사건과 인물을 연결하는 수준까지 발전했다.
[디지털투데이 AI리포터] 인공지능(AI)이 현대적 편향을 배제하고 특정 시대의 관점만 학습하도록 설계된 타임캡슐 LLM(TimeCapsule LLM)이 개발됐다.
14일(현지시간) 온라인 매체 기가진에 따르면, 1800~1875년 데이터를 기반으로 훈련된 이 모델은 당시의 언어와 세계관을 반영하는 데 초점을 맞췄다.
개발자 하이크 그리고리안은 "AI가 역사적 AI처럼 행동한다면 어떤 결과가 나올까?"라는 질문에서 프로젝트를 시작했다고 한다. 초기 버전은 단순한 모델에서 출발했지만, 마이크로소프트의 파이 1.5(Phi 1.5)를 기반으로 한 버전 1에서는 실제 역사적 사건과 인물을 연결하는 수준까지 발전했다.
타임캡슐 LLM은 당시 사회적 편향까지 반영하도록 설계됐다. 예를 들어, 데이터셋에서 남성 대명사가 여성 대명사보다 압도적으로 많이 등장하며, '런던', '잉글랜드' 같은 지명은 빈번하게 언급되지만 '아프리카', '미국'은 상대적으로 적게 등장한다. 이는 19세기 영국 중심의 시각을 반영한 결과다.
버전 2는 1800~1875년 런던에서 출판된 서적, 법률 문서, 신문 등 90GB 규모의 데이터를 활용해 학습할 예정이지만, 현재는 15GB 데이터만으로 훈련된 미니 버전이 존재한다. 예를 들어, '찰스 디킨스'에 대한 질문에 대해 당시 사회적 맥락과 감정까지 반영한 답변을 생성할 정도로 정교해졌다.
해커 뉴스(Hacker News)에서도 "1900년 이전 데이터로 AI를 훈련하고, 이후 양자역학이나 상대성 이론을 학습하게 하면 AI가 과학적 발견을 스스로 할 수 있는지 검증할 수 있다"는 의견이 나왔다.
타임캡슐 LLM은 AI가 단순히 데이터를 반복하는 것을 넘어, 역사적 맥락을 이해하고 새로운 통찰을 만들어낼 가능성을 실험하는 프로젝트로 주목받고 있다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
