컨텐츠 바로가기

04.24 (수)

‘구글’ 떨게 한 챗GPT…흑역사도 있었다

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
美로스쿨·의사 시험 합격
“아이폰 맞먹는 혁신”…최고 흥행 키워드 등극
언어모델 GPT, 과거 문장 어색하다는 지적도
피싱메일·과제 대필 ‘악용’ 부작용 있어


매일경제

지난 2020년 GPT-3가 쓴 각본으로 제작된 영화의 한 장면. 당시 대사의 문맥이 어설프다는 평을 받았다. [사진 출처 = 유튜브 캡처]

<이미지를 클릭하시면 크게 보실 수 있습니다>


웹툰 ‘신의 탑’에는 ‘에밀리’라는 이름의 인공지능(AI) 채팅 로봇(이하 챗봇)이 등장한다. 전용 단말기에 설치해 질문을 입력하면 곧장 답을 내놓는데 최단 경로부터 특정 인물에 대한 정보, 심지어 생존 여부까지 알려 준다. 에밀리는 사용자의 질문을 이해하고, 수집된 정보를 제공할 뿐 아니라 사용자에게 얻은 정보를 이용해 끊임없이 진화한다.



미국 AI 기업 오픈AI가 작년 11월 공개한 챗봇 ‘챗GPT’가 출시 후 5일 만에 100만명이 넘는 사용자를 모으며 IT 업계 최고 흥행 키워드로 부상했습니다. 해외 언론은 ‘아이폰 이후 최고의 혁신’이라고 평가하며 챗GPT에 관한 뉴스를 연일 쏟아내고 있죠.

지난 2016년 구글 딥마인드가 개발한 바둑 AI 알파고가 이세돌 9단을 꺾으며 AI의 저력을 만천하에 알린 데 이어 이번에는 챗GPT가 세상을 놀라게 하고 있습니다. 비결은 정확한 답변 능력과 쉬운 사용성인데요.

지난달 미국에서 발표된 연구에 따르면 챗GPT는 객관식 문항 95개와 에세이 작성 문항 12개로 구성된 로스쿨 시험에서 합격 점수를 받았고, 미국 의사 면허시험에서 합격선의 성적을 받았을 정도로 뛰어난 성능을 자랑합니다. 더불어 웹툰 ‘신의 탑’의 챗봇 에밀리처럼 대화 형식으로 질문과 답변이 이뤄지는 점도 사용자를 유혹했죠.

챗GPT에게 인기 비결을 묻자(Why ChatGPT is popular?)에 “방대한 텍스트 데이터를 학습해 광범위한 질문에 대해 인간과 같은 응답을 생성할 수 있기 때문”이라며 “인터페이스가 사용자 친화적이고 다양한 애플리케이션에 쉽게 녹아들 수 있다”고 답했습니다.

발전 거듭한 GPT, ‘흑역사’ 있었지만….
혁신적인 기술이 대개 그렇듯 챗GPT도 한순간에 뚝딱 만들어진 건 아닙니다. 챗GPT는 오픈AI가 지속해서 개발‧발전시켜온 언어 모델 GPT 3.5세대 버전을 기반으로 탄생했습니다.

오픈AI는 지난 2015년 일론 머스크 테슬라 최고경영자(CEO)와 샘 알트만 현 오픈AI CEO 등이 공동 설립했습니다. 그들은 2014년 구글이 딥마인드를 인수해 AI 개발에 박차를 가하자 즉시 맞불을 놨죠. 물론 구글과의 경쟁만을 목표로 설립한 건 아닙니다. 머스크에 따르면 오픈AI는 (구글처럼) 인간을 뛰어넘는 게 아닌 인간을 위한 AI 개발을 추구하니까요.

머스크는 지난 2018년 오픈AI 이사회에서 물러났습니다. 그런데 이듬해인 2019년 MS사가 오픈AI에 거액을 투자하면서 거대 기업을 등에 업게 됐죠.

오픈AI가 개발한 대표적인 AI 서비스는 자기회귀 언어 모델인 GPT 시리즈입니다. 언어 모델은 입력된 텍스트의 맥락을 파악해 다음에 나올 단어를 예측합니다. AI를 통해 방대한 텍스트 데이터를 학습함으로써 예측 정확도를 높이죠.

매일경제

챗GPT에게 자기 소개를 부탁했을 때 출력된 답변. [사진 출처 = 챗GPT 화면 캡처]

<이미지를 클릭하시면 크게 보실 수 있습니다>


‘자기회귀’라는 건 단어 예측을 연속적으로 할 수 있다는 뜻입니다. 예컨대 n개의 단어를 입력하면 n+1번째 나올 단어를 생성하고, 다시 n+1개 단어를 이용해 n+2번째 단어를 만들어 내는 식입니다.

언어 모델의 성능은 보통 학습한 데이터가 많을수록, 학습에 쓰인 AI 모델의 매개변수가 많을수록 뛰어난데 매개변수는 신경 세포를 연결하는 시냅스에 빗댈 수 있습니다. 오픈AI는 2018년 GPT-1을 출시한 이후 2019년 GPT-2, 2020년 GPT-3를 공개했습니다.

새로운 버전의 GPT가 나올 때마다 매개변수가 크게 늘었는데 사용자들이 놀랄 정도로 성능이 뛰어나거나 사용성이 좋진 못했습니다. 예컨대 2020년 10월 한 대학생이 GPT-3가 쓴 대본으로 제작한 영화를 공개했는데 앞뒤 문장은 어울리지만, 전체적인 흐름이 어색하다는 평가를 받았죠.

오픈AI는 GPT 네 번째 버전을 출시하기 전 GPT-3의 성능을 개선한 GPT-3.5를 만들고, 이를 토대로 챗GPT를 개발했습니다. 챗GPT의 강점은 문장을 잘 생성하는 데 그치지 않고 이를 활용해 번역, 요약, 정리 등 언어를 잘 이해해야 수행할 수 있는 작업을 두루 수행한다는 것입니다.

구글, ‘검색왕’ 타이틀 챗GPT에 내준다?
일부 전문가는 챗GPT가 검색 시장의 판도를 바꿀 거라고 예측하고 있습니다. 구글을 포함한 검색 엔진이 정보를 나열하는데 그치는 것과 다르게 챗GPT는 인터넷에서 학습한 수많은 데이터에서 사용자가 원하는 정보를 콕 집어 요약·정리해 주기 때문입니다.

이쯤에서 챗GPT의 성능을 알 수 있는 예시를 들어보겠습니다. 아래 질문은 영어로 작성했으며 답변은 네이버 파파고로 번역했습니다.

500kcal 미만으로 한식 점심 식단을 짜줘

비빔밥 1그릇(당근, 콩나물, 시금치, 버섯 등 채소와 고추장 양념을 섞은 밥), 잡채 1인분(양파, 피망, 버섯 등 야채 볶음), 보리차 1그릇(차)

비빔밥과 잡채는 탄수화물, 단백질, 채소의 균형 잡힌 혼합을 제공하는 인기 있는 한국 음식입니다. 칼로리 수치를 조절하기 위해 요리할 때 적당한 양의 소스와 기름을 사용하고, 고기나 튀긴 음식 같은 고칼로리 재료는 피하세요.



사과 편지의 처음 다섯 문장을 써줘

“[사과해야 할 구체적인 행동을 삽입]한 것에 대해 깊이 사과드립니다. 제 행동은 경솔했으며 당신에게 얼마나 상처를 줬는지 압니다. 제 실수에 대해 전적으로 책임을 지고 일을 바로잡기 위해 제가 할 수 있는 모든 것을 하고 싶습니다. 이것이 앞으로 더 잘하기 위한 행동임을 알아주셨으면 합니다. 부디 제 진심 어린 사과를 받아주십시오.”



하루를 빨리 지나가게 하는 팁 세 가지를 알려줘

(집중력 유지) 한 번에 한 가지 일에만 집중하고, 산만함을 줄여 시간을 최대한 활용하세요.

(몰입하기) 책 읽기, 만들기, 게임처럼 재밌고 즐길 수 있는 일에 몰입해 시간 가는 줄 모르게 하세요.

(활동적이기) 운동이나 집안일과 같은 신체 활동을 통해 몸과 마음을 바쁘게 만들고, 온종일 전진하고 있다는 느낌이 들게 하세요.



답변이 만족스럽나요? 누군가는 부족하다고 느끼겠지만, 적어도 기업들의 마음을 움직인 건 확실합니다. 이미 검색 엔진, 클라우드서비스, 온라인 뉴스 플랫폼 기업이 챗GPT를 도입하기 위해 줄을 선 상태니까요.

더욱이 검색 엔진 왕좌를 위협받은 구글은 회사를 떠난 두 창업자 래리 페이지, 세르게이 브린과 함께 챗GPT 대응책을 논의하고 있다는 소식이 전해졌는데요. 오는 5월 열리는 ‘구글 개발자 콘퍼런스’에서 챗GPT에 맞설 AI 서비스를 여럿 공개할 계획이라고 합니다.

악용 사례 속출, 혁신 아니라는 의견도
그런데 챗GPT는 부정적인 측면도 있습니다. 누구나 손쉽게 사용할 수 있어 대필 등 챗GPT를 악용한 사례들이 나오고 있는데 이를 제어할 규범들이 마련돼 있지 않습니다.

뉴욕타임스는 최근 미국 노던미시간대에서 한 학생이 챗GPT로 에세이 과제를 작성해 제출했다가 들킨 사례를 소개했는데요, 뉴욕과 시애틀 등의 일부 공립학교에서는 학교 인터넷망으로 챗GPT에 접속할 수 없도록 했지만, 대학교는 자율성을 침해할 수 있어 여의찮다고 전했습니다.

한편 세계적인 보안 업체 체크포인트는 챗GPT가 악성코드, 피싱메일 제작에 활용될 수 있다고 경고했습니다. 사용자가 코딩 지식을 몰라도 질문만 정확히 한다면 챗GPT가 대신 코드를 만들어주기 때문입니다.

매일경제

[사진 출처 = 연합뉴스]


챗GPT는 아직 완전하지 않습니다. 학습 데이터가 과거에 머물러 있어 최신 이슈에 답하지 못할 수 있고, 오답인데도 확신에 찬 것처럼 답할 때도 있죠. 또 오픈AI가 원칙적으로 폭력, 혐오 발언 등 윤리적인 문제가 있는 답변은 할 수 없도록 한 것도 한계점입니다.

향후 챗GPT의 성능이 개선되면 더 많은 부작용이 생길 수 있지만, 동시에 세상에 가져올 변화가 기대됩니다. 그 전에 AI와 인간의 공존을 위한 윤리 규범과 법이 갖춰져야 하겠죠?

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.