이빗 로고/사진제공=이빗 |
AI(인공지능) 학습 데이터 전문기업 이빗(대표 박용한)은 과학기술정보통신부가 주관하고 한국데이터산업진흥원(K-DATA)이 운영하는 '2026년 데이터바우처 지원사업'의 공급기업으로 선정됐다고 23일 밝혔다.
데이터바우처 지원사업은 중소기업과 스타트업, 연구기관의 데이터 구매 및 가공 비용을 지원, 데이터 기반 서비스·제품을 개발할 수 있도록 돕는 정부 사업이다. 이빗은 이번 선정으로 수학과 고급 코딩 중심의 AI 학습 데이터를 공급하며 차세대 대형언어모델(LLM)과 도메인 특화 AI 모델 개발을 지원할 방침이다.
이빗이 제공하는 데이터는 수학적 추론, 알고리즘적 사고, 문제 해결형 코드 생성·분석을 포함한 고난도 학습 데이터로 구성된다. 단순 질의응답을 넘어 다단계 추론과 논리적 사고 능력 향상에 초점을 맞췄다. 회사 측은 문제 해결 과정과 단계별 추론 구조를 함께 제공, AI 모델이 안정적이고 설명 가능한 출력을 생성할 수 있다고 설명했다.
해당 데이터셋은 AI 모델 학습과 평가에 즉시 활용할 수 있도록 정형화된 포맷과 난이도·유형별 분류 체계, 다단계 품질 검수 프로세스를 기반으로 구축된다. 수요기업은 데이터 설계와 전처리 시간 및 비용을 줄이고 모델 개발과 실험에 집중할 수 있다는 설명이다.
회사 관계자는 "수학과 코딩 도메인을 넘어 △금융 △경영 △과학기술 △일반 지식 등의 산업·전문 영역으로 확장 가능한 데이터 구축 역량을 갖췄다"면서 "금융 계산과 리스크 분석, 수치 기반 의사결정, 도메인 지식 추론 등 산업 활용도가 높은 데이터 유형도 수요에 맞춰 커스터마이징한다"고 말했다.
이어 "글로벌 빅테크 기업의 AI 학습 데이터 구축 프로젝트를 수행한 경험을 바탕으로 최근 국내 LLM 개발사 및 AI 스타트업과의 협업을 확대하고 있다"며 "다국어·고난도 추론 데이터 구축 경험으로 글로벌 수준의 데이터 품질과 운영 노하우를 축적해 왔다"고 덧붙였다.
박용한 이빗 대표는 "중소기업과 스타트업, 연구기관이 고품질의 수학·코딩 기반 AI 학습 데이터를 효율적으로 활용할 수 있도록 돕겠다"며 "다양한 산업 도메인으로 확장 가능한 데이터 구축 역량으로 수요기업의 AI 모델 성능 고도화와 연구·개발 경쟁력 강화를 지원하겠다"고 했다.
이두리 기자 ldr5683@mt.co.kr
Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
