스프레드시트LLM [사진: 마이크로소프트] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 마이크로소프트(MS)의 AI 연구팀이 스프레드시트LLM(SpreadsheetLLM)이라는 연구 보고서를 발표했다고 16일 대만 IT홈이 전했다.
스프레드시트는 많은 셀들로 이루어져 있으며 텍스트, 숫자, 수식 또는 함수가 포함된 다양한 행과 열로 이루어진 유연하고 복잡한 2차원 구조를 형성한다. 또 글꼴, 색상, 테두리 등 다양한 서식 옵션이 있어 대규모언어모델(LLM)에 상당한 어려움을 준다. 따라서 연구진은 LLM이 스프레드시트의 내용을 이해하고 정확한 추론을 할 수 있도록 돕기 위해 '스프레드시트LLM' 프레임워크를 개발했다.
연구진은 먼저 셀 주소, 값 및 형식을 결합한 간단한 직렬화 방법을 사용했지만, 이는 LLM에서 제한됐고 효과적이지 않았다고 한다. 이에 연구진은 스프레드시트를 인코딩하고 압축하는 데 사용하는 시트컴프레서(SheetCompressor)를 개발했다. 이는 이전보다 25.6% 높은 성능을 발휘했다고 한다.
연구진은 스프레드시트LLM이 스프레드시트의 처리와 이해에서 상당한 진전을 나타낸다고 밝혔다. 이는 스프레드시트의 크기, 다양성, 복잡성이 제기하는 도전에 효과적으로 대응하며 필요한 토큰과 계산 비용을 크게 줄였다는 설명이다.
아울러 이는 대규모 데이터셋에 실용적으로 적용될 수 있으며, 다양한 LLM의 세밀한 조정은 스프레드시트를 이해하는 능력을 향상시킬 수 있다고 연구진은 전했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.