컨텐츠 바로가기

04.25 (목)

‘페미니즘’ 단어 오염시킨 구글·네이버·카카오 번역기, 왜?

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
AI 번역기, 페미니즘-여성우월주의 구분 못 해

파파고, 소녀는 “야망녀” 소년은 “야심가”로도

“인공지능 번역이 여성혐오·백래시 학습”


한겨레

구글 번역은 한국어 ‘여성우월주의’를 ‘feminism’(여성주의)으로 번역했다. 사진 구글 번역 갈무리

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글·네이버·카카오 번역기가 ‘여성우월주의’를 ‘feminism’(여성주의)으로 오역하는 등 여성주의에 대한 편견과 성차별을 다수 노출하는 것으로 드러났다. 이들 인공 신경망이 해당 편견이 담긴 정보(문장 등)를 거르지 못하고 학습한 탓이다.

지윤주(한국외대 일반대학원 영어번역학과 박사수료)씨는 논문 ‘웹 코퍼스를 활용한 신경망 기계번역의 안티-페미니즘(Anti-Feminism)현상 연구’에서 구글 번역·네이버 파파고·카카오 아이(i)번역이 여성우월주의를 ‘feminism’으로 번역하는 경향성을 띈다고 지적했다. 이러한 번역오류가 가장 많은 번역기는 구글 번역(83%)이었다. 카카오 아이번역과 네이버 파파고의 번역 오류 비율은 각기 33%, 25%였다. 논문은 지난해 12월 나온 한국번역학회 학술지 <번역학연구>에 실렸다.

이는 신경망이 학습하는 한국어 문장에 반여성주의적 표현이 상당수란 의미도 갖는다. 번역엔진들은 문장을 통째로 학습시키는 ‘신경망 기계번역’(NMT·Neural Machine Translation) 방식을 쓴다. 인공두뇌가 어떤 문장을 학습했느냐에 따라 결과물이 변한다.

지윤주씨는 국문 기사 가운데 ‘여성우월주의’와 ‘페미니즘’이란 단어가 함께 쓰인 문장 12개를 골라 세 번역엔진에 입력했다. 예컨대 “페미니즘은 ‘여성우월주의’도 생물학적 여성만을 위한 사상도 아니다”(2019년 12월 <한겨레> 기사)를 구글은 “Feminism is not ‘feminism’ nor is it an ideology exclusively for biological women”(페미니즘은 페미니즘도, 생물학적 여성만을 위한 사상도 아니다)으로 영문 번역했다. 페미니즘과 여성우월주의를 모두 ‘feminism’으로 옮겨 본뜻과 동떨어진 문장이 되었다. 카카오 아이번역도 “Feminism is neither a ‘feminism’ nor a thought for biological women”으로 옮긴 반면, 네이버 파파고는 “Feminism is neither a ‘female supremacy’…”라고 근접해 번역했다.

한겨레

게티이미지뱅크

<이미지를 클릭하시면 크게 보실 수 있습니다>


하지만 네이버 파파고도 예시문에 따라 유사한 오류를 반복했다. “페미니즘의 사전적 의미에서는 사회 일각에서 주장하는 ‘여성우월주의’, ‘남성 혐오주의’, ‘여성극우주의’라는 프레임은 찾아볼 수 없다”(2021년 6월 <뉴시스> 기사)는 문장을 “In the dictionary sense of feminism, there are no frames of ‘feminism’, ‘male hatred’, or ‘feminism’ that some argue”로 영문 번역한 것처럼 여성우월주의, 여성극우주의가 구분 없이 feminism으로 소개됐다.

3개 엔진별 번역오류 비율은 지윤주씨가 2021년 7월~10월 확인한 결과를 토대로 도출됐다. 27일 <한겨레>가 이 문장들을 다시 번역엔진에 입력해보니 일부 오역은 바로잡혀 있기도 했다.

여성우월주의와 페미니즘을 구별 없이 혼용해 도출하는 번역 현상은 페미니즘이라는 개념어가 그만큼 오염됐다는 의미이기도 하다. 지윤주씨는 여성우월주의를 ‘feminism’으로 번역하는 패턴이 실제 언어생활을 반영한 것인지 추가 분석한 결과, ‘여성우월주의’의 상위 공기어는 페미니즘, 남성혐오, 메갈리아, 워마드 등과, 반면 영어 ‘feminism’의 공기어는 radical(급진적인), wave(흐름), Marxism(마르크시즘), gender(젠더), queer(퀴어)와 연결되는 차이도 확인했다. 언어분석 도구 스케치 엔진으로 ‘여성우월주의’와 ‘feminism’의 공기어(한편의 글에서 해당 단어와 함께 출현하는 단어)를 추출해 대조한 결과다.

지윤주씨는 “한국어 ‘여성우월주의’는 feminism의 음차어인 ‘페미니즘’과 가까운 의미를 보이는 것으로 추정되며, 또한 부정적 맥락으로 사용된다고 볼 수 있다. 하지만 영어권 사회에서 ‘feminism’은 여성 운동이나 사회이론과 역사를 지칭하는 페미니즘 ‘운동’의 맥락으로 쓰인다”고 했다.

한겨레

구글 번역, 카카오 아이(i)번역, 네이버 파파고. 사진 각 페이지 갈무리


지윤주씨는 지난해 학술지 <통역과 번역>에 발표한 논문 ‘신경망 기계번역 내 젠더 문제 고찰 연구’에서 구글·네이버 번역엔진이 영문 수식어를 우리말로 옮길 때 나타나는 젠더 편견 문제를 지적하기도 했다. 네이버 경우 ‘innocent girl’은 “청순녀”, ‘innocent boy’는 “천진난만한 소년”으로, ‘ambitious girl’은 “야망녀”, ‘ambitious boy’는 “야심가”로 풀었다. ‘형용사+girl’을 유독 ‘○○녀’로 옮기고, 같은 구조에서도 소년 수식 때 번역이 달라지는 패턴은 구글보다 네이버에서 두드러졌다. 저자는 “구글 번역에서는 검출되지 않는 여성 비하와 혐오로 일컬어지는 표현, 전통적이고 보수적인 성역할 함의가 있는 패턴의 영한 번역물이 파파고에선 다수 검출됐다”며 “기계번역은 그 운용체제의 기반이 되는 사회의 언어를 중심으로 이루어져 있으며, 이로 인해 해당 언어권에 내재한 사회적 편견과 고정관념을 그대로 수용한다”고 지적했다.

지윤주씨는 <한겨레>에 “지난해 2020 도쿄올림픽 양궁 금메달리스트인 안산 선수를 향해 부정적 함의를 담아 ‘페미니스트’라고 공격하는 온라인 안티페미니즘 현상을 목격한 것이 연구 계기가 됐다”며 “인공지능 기반 신경망 기계번역이 한국의 온라인 여성혐오와 백래시를 그대로 학습하는 현상이 안타깝다. 이에 대한 사회적 논의가 필요하다고 본다”고 했다.

최윤아 기자 ah@hani.co.kr

벗 덕분에 쓴 기사입니다. 후원회원 ‘벗’ 되기
항상 시민과 함께 하겠습니다. 한겨레 구독 신청하기‘주식 후원’으로 벗이 되어주세요!

[ⓒ한겨레신문 : 무단전재 및 재배포 금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.