컨텐츠로 건너뛰기
검색
디지털투데이 언론사 이미지

중국발 AI 혁명인가…GLM-4.7-플래시, GPT-OSS-20B 능가

디지털투데이
원문보기

중국발 AI 혁명인가…GLM-4.7-플래시, GPT-OSS-20B 능가

속보
경찰, 이 대통령 피습 테러사건 TF 구성
[이윤서 기자]
GLM-4.7-플래시와 경쟁사 모델 테스트 결과 [사진: Z.ai]

GLM-4.7-플래시와 경쟁사 모델 테스트 결과 [사진: Z.ai]


[디지털투데이 이윤서 기자] 중국 인공지능(AI) 기업 Z.ai가 초경량 AI 모델 GLM-4.7-플래시(GLM-4.7-Flash)를 공개하며, 오픈AI의 GPT-OSS-20B를 넘어서는 성능을 입증해 화제를 모으고 있다.

20일(현지시간) 온라인 매체 기가진은 주요 벤치마크 테스트 결과를 인용, GLM-4.7-플래시가 추론 및 연산 능력 등 핵심 지표에서 GPT-OSS-20B를 뚜렷하게 앞섰다고 보도했다.

GLM-4.7-플래시는 여러 전문 모델을 결합한 MoE(전문가 혼합, Mixture of Experts) 아키텍처를 채택했으며, 총 300억개 파라미터를 보유하고 있다. 그러나 활성 파라미터는 30억개에 불과해 경량화된 구조를 유지하면서도 높은 성능을 발휘하는 것이 특징이다.

실제 GLM-4.7-플래시는 큐웬3-30B-A3B-씽킹-2507(300억 파라미터, 활성 파라미터 30억), GPT-OSS-20B(210억 파라미터, 활성 파라미터 36억)와의 비교 테스트에서 압도적인 성능을 보였다. 특히 웹 검색 능력을 측정하는 브라우즈컴프(BrowseComp) 테스트에서도 경쟁 모델을 큰 차이로 앞질렀다.

또한 해당 모델은 오픈모델로 개발됐으며, MIT 라이선스로 공개됐다. 모델 데이터는 허깅페이스(Hugging Face)에서 다운로드할 수 있다. BF16 버전은 45GB 이상의 VRAM이 필요하며, RTX 4090에서도 실행 가능한 양자화 버전이 곧 출시될 예정이다.

업계는 이번 GLM-4.7-플래시가 MIT 라이선스로 풀렸다는 점에 주목하고 있다. 상업적 이용이 자유로운 고성능 경량 모델의 등장은 오픈AI를 비롯한 빅테크 위주의 시장 판도에 적지 않은 영향을 미칠 것으로 예상된다.


접근성 개선에 대한 기대감도 높다. 현재 공개된 BF16 버전은 엔터프라이즈급 GPU가 필요하지만, Z.ai 측이 예고한 양자화 버전이 출시되면 상황은 달라진다. 일반 소비자용 그래픽카드인 RTX 4090 등에서도 구동이 가능해질 경우, 개인 개발자와 중소기업의 진입 장벽을 낮춰 오픈소스 생태계 확장을 가속화할 전망이다.

이번 사례는 AI 기술 경쟁의 흐름이 단순한 크기 싸움에서 효율성 대결로 바뀌고 있음을 보여준다. 덩치는 줄이면서도 성능은 높인 경량화 모델이 잇따라 등장함에 따라, 일반 사용자도 집에서 고성능 AI를 손쉽게 활용하는 시대가 예상보다 빨리 열릴 것으로 보인다.

Introducing GLM-4.7-Flash: Your local coding and agentic assistant.

Setting a new standard for the 30B class, GLM-4.7-Flash balances high performance with efficiency, making it the perfect lightweight deployment option. Beyond coding, it is also recommended for creative writing,… pic.twitter.com/gd7hWQathC

— Z.ai (@Zai_org) January 19, 2026<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>