컨텐츠로 건너뛰기
검색
이데일리 언론사 이미지

비큐AI, 초경량 소형언어모델 ‘RDP-N1’ 개발…CoT 데이터로 성능 93%↑

이데일리 신하연
원문보기

비큐AI, 초경량 소형언어모델 ‘RDP-N1’ 개발…CoT 데이터로 성능 93%↑

속보
무인기 군경합동조사 TF, 오늘 용의자 1명 소환
[이데일리 신하연 기자] 비큐AI(148780)는 자체 구축한 CoT(Chain-of-Thought) 데이터셋을 활용해 오픈소스 7B 기반 모델을 파라미터 효율적 미세 조정(Parameter-Efficient Fine Tuning, PEFT) 방식으로 학습한 초경량 소형언어모델(sLLM) ‘RDP-N1’을 개발했다고 16일 밝혔다.


이번 모델은 QLoRA(Quantized Low-Rank Adaptation) 기법을 적용해 기존 파라미터 손상을 최소화하고, 양자화 기술로 모델 용량을 29GB에서 7.1GB로 줄였다. 이를 통해 EM·ROUGE·BLEU·KoBERT 유사도 등 주요 지표에서 최대 93% 성능 향상을 달성했다. 이는 RDPLINE에서 생산되는 고품질 CoT 데이터의 효과를 정량적으로입증한 결과로 분석된다.

CoT 데이터는 단순히 정답을 제공하는 것이 아니라, 정답에 도달하는 추론 과정을 함께 학습하도록 설계된 데이터다. 예를 들어 ‘답은 A’에 그치지 않고, ‘추론 근거와 판단 조건을 단계적으로 제시해 결론에 이르는 과정’을 포함한다.

비큐AI 관계자는 “CoT 데이터는 수작업으로 구축하기 어려워, 로우데이터를 기반으로 질의응답과 추론 과정을 생성하고, 상용 고성능 LLM으로 자동 평가해 오답·모순을 제거하는 단계적 검증 체계를 적용했다”며 “이 과정을 통해 고신뢰 데이터만 선별해 학습에 활용했다”고 밝혔다.

이어 “이번 개발은 모델 자체 제작보다, 고품질 CoT 데이터가 성능 향상에 미치는 효과를 검증하는 데 초점을 맞췄다”며 “동일한 원리로 더 큰 파라미터 모델에도 적용 가능한 점이 큰 의미를 가진다”고 덧붙였다.

향후 비큐AI는 RDPLINE을 통해 확보한 대규모 뉴스·미디어 데이터 파이프라인을 기반으로 ‘RDP-N1’을 다양한 서비스 영역에 적용하고, 경량 모델과 고성능 모델을 조합해 성능과 비용을 최적화하는 전략을 추진할 방침이다.