[※ 편집자 주 = 한국국제교류재단(KF)의 2024년 발표에 따르면 세계 한류 팬은 약 2억2천5백만명에 육박한다고 합니다. 또한 시간과 공간의 제약을 초월해 지구 반대편과 동시에 소통하는 '디지털 실크로드' 시대도 열리고 있습니다. 바야흐로 '한류 4.0'의 시대입니다. 연합뉴스 K컬처 팀은 독자 여러분께 새로운 시선의 한국 문화와 K컬처를 바라보는 데 도움이 되고자 전문가 칼럼 시리즈를 준비했습니다. 시리즈는 매주 게재하며 K컬처 팀 영문 한류 뉴스 사이트 K 바이브에서도 영문으로 보실 수 있습니다.]
임기범 인공지능경영학회 이사 |
지난 5월 개방형 온라인 출판 플랫폼인 위키독스 회원인 '전뇌해커'가 인공지능 거대언어모델(이하, LLM)별로 한국어 사용성 순위를 발표했다. 그는 "제가 손수 만든 문제로 여러 LLM을 시험을 치르게 해서, 한국어로 사용하기가 얼마나 좋은지를 평가했고 100점 만점으로 환산해서 순위를 매긴 결과"라고 말했다.
그는 또, "벤치마크 설계가 단순하고, 계산에 몇 가지 허점이 있다"며 "모델별로 같은 질문에 대해 여러 번 테스트해서 평균을 내지 않고 한두 번씩만 테스트했고 LLM별로 시도 횟수, 시기에 차이가 있으며 문제별로 테스트 횟수가 동일하지 않아서 문제별 배점이 달라지고 비일관적일 수 있다"고 한계를 밝히기도 했다.
그 결과. Claude 3 opus가 1위를 차지했다. 널리 알려진 챗 GPT 4o는 3위에 그쳤다. 물론 이 결과는 그저 이러한 내용이 나올 수 있다는 어느 파워유저의 실험이라는 분명한 한계가 있다.
하지만 LLM의 한국어 사용성에 대해서는 깊이 생각해 볼 필요가 있다.
다국적 기업의 LLM이 한국어를 '지원'한다고 해서 안심해서는 안 된다.
한국어의 복잡한 존댓말 체계, 미묘한 뉘앙스의 차이 그리고 수천 년에 걸쳐 형성된 우리만의 문화적 맥락은 단순한 '지원'으로 해결될 수 있는 문제가 아니다.
"어르신, 진지 잡수셨어요?"라는 한 문장 속에 담긴 우리 문화의 정수를 외국 AI가 온전히 이해하고 구사할 수 있을 거라 기대하는 것은 순진한 생각이다.
더 심각한 것은 우리의 역사와 사회 현상을 다룰 때다.
'위안부', '동해', '독도', '세월호' 같은 키워드는 단순한 사건이나 개념이 아니라 한국 사회의 아픔과 갈등 그리고 치유의 과정을 담고 있다.
이런 복잡한 맥락을 외국 AI에게 맡긴다면 우리의 역사와 사회 문제가 왜곡되거나 축소될 위험이 크다. 절대 용납할 수 없는 일이다.
한국형 LLM 개발의 필요성은 단순히 문화적 차원을 넘어선다. 곧바로 경제적 효과와도 직결된다.
한국국제교류재단의 보고서에 따르면 한류의 경제적 파급효과는 2021년 기준 약 65조 원에 달한다고 한다. 한국형 LLM은 이러한 한류 콘텐츠의 생산과 유통 그리고 글로벌 확산을 더욱 가속할 수 있다. 더불어 AI 기반 서비스 산업의 성장을 고려하면, 한국형 LLM 개발은 새로운 경제 성장의 동력이 될 수 있다.
물론 한국형 LLM 개발에는 막대한 비용과 시간이 필요하다. 하지만 비용이 아닌 투자로 봐야 한다.
AI 기술이 국가 경쟁력의 핵심으로 부상하는 현재, 자체 LLM 모델 확보는 국가 안보의 차원에서도 필수 불가결하다.
그런데 우리의 상황은 어떠한가?
현재 국내 기업의 LLM 개발 현황을 보면 실망을 넘어 분노를 느낄 정도다.
특히 대기업들의 행태는 충격적이다.
네이버의 '하이퍼클로버X'를 찬찬히 살펴봤다.
전 세계의 검색시장을 독점하다시피 장악하고 있는 구글이 유일하게 넘보고 있지 못하는 곳이 한국의 네이버다.
그런 명성이 무색하게도 네이버에서 발표한 LLM의 성능은 형편없기 그지없다. 대화의 맥락을 제대로 파악하지 못하고 간단한 질문에도 엉뚱한 답변을 내놓는 경우가 비일비재하다.
단순한 실망을 넘어 국내 AI 기술의 현주소를 적나라하게 보여주는 부끄러운 현실이다.
필자는 지난해 3월 OpenAI가 GPT-4를 발표했을 때의 놀라움을 잊지 못한다.
우리도 꼭 저런 모델을 개발해야 한다는 생각과 함께 네이버에 대한 기대감을 SNS에 올렸던 기억이 아직도 생생하다.
사실 LLM의 학습을 위해 수많은 데이터가 필요하다는 점을 감안할 때, 젊은이의 자유로운 표현으로 가득한 데이터를 가진 카카오보다는 블로그와 카페, 지식iN 데이터로 무장한 네이버에 훨씬 더 많은 기대를 했던 것이 사실이다.
하이퍼클로버X가 발표된 날의 커다란 아쉬움은 그런대로 금방 해결할 수 있다고 기대했다. 그러나 반년이 넘어 1년 가까이 지난 지금에도 별반 달라지지 않은 성능을 보며 허무함을 넘어 허탈감까지 느껴지고 있다.
더욱 분노를 자아내는 것은 이러한 형편없는 성능과 품질에도 불구하고 네이버가 보이는 태도다. 그들은 성능 개선에 매진하기는 커녕 과장된 홍보와 마케팅에만 열을 올리고 있다.
마치 옷을 제대로 갖춰 입지도 않은 채 거울 앞에서 포즈만 취하는 꼴이다. 기술 발전을 위한 진정성 있는 노력이라기보다는 주가 관리와 기업 이미지 제고를 위한 기만적 행위에 가깝다.
반면 스타트업인 업스테이지의 '솔라'는 상대적으로 좋은 성능을 보여주고 있다. 지난해 12월 허깅페이스의 오픈소스 LLM 랭킹 보드에서 TOP10 중 7개를, 특히 1위부터 6위까지를 싹쓸이했다. 필자는 아직도 그때의 감동과 설렘을 잊을 수 없다.
하지만 기업 규모의 특성상 글로벌 기업과의 경쟁에서는 한계를 보일 수밖에 없는 실정이다.
우리나라 AI 생태계의 또 다른 비극이다. 실력 있는 스타트업이 고군분투하는 동안 제대로 된 지원을 받지 못한 채 소외되고 있는 형국이다. 추가적인 연구개발이 아닌 돈을 벌기 위한 구축사업에 매달리고 있다.
이러한 현실은 한국형 LLM 개발의 시급성을 더욱 극명하게 보여준다.
우리나라는 더 이상 이대로 있어서는 안 된다. 국내 기업의 LLM 개발 현황은 단순히 부끄러운 수준을 넘어 국가 경쟁력을 심각하게 위협하는 수준에 이르렀다. 글로벌 AI 경쟁에서 우리나라가 뒤처지고 있다는 것은 더 이상 기우가 아닌 현실이 되고 있다.
따라서 이제 정부, 대기업, 스타트업 그리고 학계가 힘을 모아 당장 행동에 나서야 한다.
정부는 대규모 투자와 규제 완화를 통해 LLM 개발의 기반을 마련하고, 대기업은 자금력과 인프라를 바탕으로 장기적인 연구 개발에 나서야 한다. 또한 실력 있는 스타트업에 대한 과감한 투자와 지원을 통해 업스테이지와 같은 기업들이 글로벌 무대에서 경쟁할 수 있도록 해야 한다.
마지막으로 산학연 협력체계를 강화해야 한다.
대학과 연구소의 뛰어난 인재들이 실제 LLM 개발 현장에 투입될 수 있도록 하고, 오픈소스 커뮤니티를 활성화해 다양한 아이디어와 기술이 공유되고 발전할 수 있는 생태계를 만들어야 한다.
이러한 협력 체계가 갖춰질 때 비로소 우리는 세계적 수준의 한국형 LLM을 보유할 수 있게 될 것이다.
한국형 LLM은 단순히 우리말을 잘하는 AI를 만드는 것이 아니다. 우리나라의 언어, 문화, 역사, 가치관을 온전히 담아낼 수 있는 AI를 만드는 것이다.
디지털 시대에 우리의 문화적 주권을 지키고 더 나아가 한국의 소프트 파워를 전 세계에 알릴 기회다.
물론 한국형 LLM 개발 과정에서 우리가 주의 깊게 살펴봐야 할 사항들이 많이 있다.
자원의 집중 문제나 데이터 편향의 위험성, 특정 기업에의 기술적 종속에 대한 우려나 프라이버시 문제 등 잠재적 위험 요소들이 존재하는 것은 사실이다.
하지만, 이러한 잠재적 위험이 우리나라가 한국형 LLM 개발을 포기해야 할 이유가 될 수는 없다. 이것은 오히려 우리가 더욱 신중하고 책임감 있게 접근해야 할 이유일 것이다.
정부와 기업 그리고 학계와 시민사회 등이 협력하여 이러한 문제들을 해결해 나간다면 우리는 안전하고 효과적인 한국형 LLM을 개발할 수 있을 것이다.
한국형 LLM 개발은 단순한 기술적 도전이 아니다.
우리의 문화적 정체성을 지키고 글로벌 AI 시대에 우리만의 목소리를 낼 중요한 기회임을 간과해서는 안 된다.
위험성을 인지하고 슬기롭게 극복해 나가면서 우리만의 독특한 언어와 문화를 담은 AI를 만들어 나가는 것, 그것이 바로 우리가 나아가야 할 길인 것이다.
한국형 LLM 개발은 더 이상 선택이 아닌 필수다.
우리의 말과 마음을 이해하는 AI, 그것이 바로 우리가 반드시 만들어내야 할 미래다. 이제 행동해야 할 때다. 우리의 미래를 우리 스스로 만들어 나가자.
※ 외부 필진 기고는 본사의 편집 방향과 다를 수 있습니다.
2024345@yna.co.kr
▶제보는 카카오톡 okjebo
▶연합뉴스 앱 지금 바로 다운받기~
▶네이버 연합뉴스 채널 구독하기
<저작권자(c) 연합뉴스, 무단 전재-재배포, AI 학습 및 활용 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.