컨텐츠 바로가기

04.24 (수)

네이버 2차 뉴스 알고리즘 검증도 '편향성' 없다

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
핵심요약
2차 뉴스 알고리즘 검토위 결과 발표
특정 언론사 이념이나 성향 우대 안 해
다만 결과적 '불평등' 요소 있어…대형 언론사 유리
노컷뉴스

연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>


연합뉴스네이버의 뉴스 검색·추천 알고리즘에 특정 언론사의 이념과 성향을 우대하거나 제외하는 요소가 없다는 검증 결과가 나왔다.

네이버는 '제2차 네이버 뉴스 알고리즘 검토위원회'가 지난해 8월부터 올해 1월까지 6개월까지 활동한 결과를 26일 자사 블로그를 통해 발표했다.

검토위는 한국언론학회, 한국언론정보학회, 한국정보과학회 언어공학연구회, 한국정보과학회 인공지능 소사이어티에서 추천을 받은 12명의 위원이 활동했다. 성균관대학교 고영중 교수가 위원장을 맡았다.

검토위는 "뉴스 검색 알고리즘 작동과 관련해 뉴스 기사 검색 및 추천 후보를 생성하고 랭킹을 부여하는 단계에서 언론사의 이념과 성향을 분류하여 우대하거나 제외하는 요소는 찾아볼 수 없었다"고 밝혔다.

그러면서 "알고리즘에 적용되는 다양한 자질 목록과 가중치를 검토한 결과, 송고된 기사수, 송고 시점 및 기사의 최신성 등 뉴스 생산과 관련된 활동이 더 연관성이 높았"고 덧붙였다.

검토위는 다만 이러한 구조 하에서는 대형 언론사가 상대적으로 '유리한 위치'를 차지할 수 있다고 지적했다. 검토위는 "뉴스 생산과정에서 결과적으로 규모가 크고 인력과 자원이 풍족한 언론사에게 유리할 수 있다는 것을 확인했다"며 "이는 뉴스 생산의 절대적인 양 그리고 매일매일 업데이트되는 새로운 데이터로부터 출발해야 하는 '콜드 스타트(cold start)' 문제와도 관련이 있다"고 지적했다.

또한 검토위는 네이버의 뉴스 검색 알고리즘이 어뷰징이나 검색어 질의와 상관없는 뉴스를 필터링하는 데 최적화된 만큼 심층 뉴스 등은 결과적으로 노출이 적어질 수 밖에 없다고 설명했다. 검토위는 "당시의 주류 논조를 벗어나는 담론을 담고 있는 기사, 심도 있는 기사는 자동화된 검색 결과로서는 탐색되기 어려운 것을 확인했다"고 밝혔다.

노컷뉴스

연합뉴스

<이미지를 클릭하시면 크게 보실 수 있습니다>


연합뉴스검토위는 네이버에 심층보도나 대안, 지역 언론사의 뉴스들이 노출될 수 있는 방안들을 고려해야한다고 요구했다. 또 알고리즘에 의도적인 편향이 없더라도, 뉴스 생산자의 역량에 따른 결과적 불균형을 개선할 수 있는 방안을 고려해야한다고도 주문했다.

검토위는 "인공지능의 기술 공정성을 평가하는 기술이 발달되고 있다"며 "이들 기술을 활용한 투명성과 신뢰를 바탕으로 검색, 추천 알고리즘 개발을 더욱 진행하는 방향을 기대한다"고 말했다.

네이버의 알고리즘 검토위 구성은 이번이 두번째다. 네이버는 뉴스 알고리즘 논란이 불거지자 2018년 처음으로 외부 인사로 구성된 '1차 네이버뉴스 알고리즘 검토위'를 발족한 바 있다. 당시 6개월간의 검토 결과 검토위 측은 "문제가 없다"는 결론을 내렸다.

이후 2020년 9월 더불어민주당 윤영찬 의원이 보좌진에 포털 다음에 노출된 기사를 보고 '카카오 들어오라고 하세요'라는 문자 메시지를 보내는 사실이 포착돼 논란이 재점됐고, 네이버는 2차 검토위를 꾸렸다.

다음은 2차 알고리즘 검토위의 주요 질답

-네이버 뉴스 알고리즘의 편향성 관련된 검토는 어떤 방식으로 살펴보았고, 검토 과정의 신뢰성은 어느 정도로 평가할 수 있나 소스 코드는 확인했는가
=검토위원회는 네이버 뉴스 알고리즘의 구성과 내용에 있어 중립성이 확보되어 있는지 살펴보기 위해 네이버로부터 수차례 필요한 자료와 데이터를 요청해 전달받았다. 검토가 필요한 부분을 중심으로 질의 응답 방식으로 설명을 들었다.
=또한 각 위원들이 해당 내용을 검토하면서 필요한 질의 내용이 생길 때 네이버로부터 자료를 전달받았다. 소스 코드 전체를 확인하기에는 물리적 시간의 한계가 있어 필요한 부분의 코드 개발과 서비스 배포 과정을 확인할 수 있었다.

-네이버 뉴스에서 필터버블의 문제는 없었는지, 있다면 이에 대한 보완이 있었는지
=오전에는 기사가 많이 들어오니 사람들 간의 중복도가 많다가 오후에는 개인의 클릭 정보 등이 반영이 되어서 개인화가 되어 중복도가 낮아질 수 있다. 오전에 많은 기사의 유입이 필터버블은 완화시킬 수도 있지만 많은 기사가 같은 주제로 중복되어 들어오면 필터버블 우려가 생길 수 있다. 다만 네이버에서는 선호 언론사가 아니어도 사회적 관심사와 공적 사안에 대한 노출을 위한 비개인적 요소를 함께 고려하고 있어 개인 수준에서의 필터버블과 같은 효과가 완화될 수 있다고 평가했다. 사회적인 수준에서는 장기간에 걸친 필터 효과가 나타날 수 있다고 볼 여지도 있다.

-네이버 추천 뉴스에서 특정 언론사들의 기사가 상대적으로 더 많이 추천되는 양상을 검토위원회는 어떻게 분석했나
=네이버 뉴스의 전반적인 추천 과정이 송고되는 기사의 양이 많은 언론사에게 유리하게 동작하는 것으로 우려되는 부분이 존재한다고 판단했다. 네이버 뉴스 알고리즘 추천 결과 언론사가 다량의 기사를 자주 송고할 경우 최신성이나 기사들의 클러스터 구성 등에서 유리한 점을 가질 수 있다는 점을 알 수 있었다. 로그인한 사용자의 경우 다양한 취향을 종합하여 추천하기 때문에 단순히 기사의 양이나 최신성 만으로 추천되지 않는 것을 확인할 수 있었다.
=이런 문제를 완벽히 보완하는 방법은 모든 언론사를 기계적으로 동등하게 취급하는 것이지만 이렇게 동일하게 추천하는 것이 꼭 옳은 것인가 하는 이슈도 있다. 이는 향후 많은 고민과 실험, 그리고 결과에 대한 사용자의 평가를 통해서 보완되어야 할 것으로 생각한다.

-네이버에서 설계한 알고리즘에 대해 중간에 인위적인 개입 및 수정이 이루어질 수 있는가
=알고리즘에 기반해 서비스하는 뉴스 영역에서 인간 편집자가 인위적으로 개입할 수 있는 가능성은 발견되지 않았다. 학습데이터의 구성이 중간에 인위적으로 수정되거나 알고리즘을 구성하는 자질이 특정 기간 동안 임의로 수정되기 어렵다는 점을 확인할 수 있었다. 특히, 알고리즘의 자질을 변경하고 보완하는 일은 단기간에 수행되기 어려우며 수정에 대한 이력이 기록으로 남기 때문에 인위적인 개입이 가능하지 않은 환경으로 파악하고 있다.

저작권자 © CBS 노컷뉴스 무단전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.