컨텐츠 바로가기

04.20 (토)

사투리·국내 주요도로 등 AI 학습용 데이터 170종 개방

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

스타트업·중소기업·대기업 등 누구나 활용가능

연합뉴스

AI (인공지능) (PG)
[장현경 제작] 일러스트



(서울=연합뉴스) 정윤주 기자 = 정부가 지난해부터 구축한 인공지능(AI) 학습용 데이터 170종을 개방한다.

과학기술정보통신부와 한국지능정보사회진흥원은 포털 'AI허브'로 학습용 데이터 4억8천만 건을 개방한다고 18일 밝혔다.

AI 학습용 데이터는 AI 개발에 사용된다. 그간 AI 기업들은 해외에서 개방한 데이터를 활용했다. 그러나 이런 해외 데이터는 한국어나 국내 도로 환경 등을 반영하지 못해 국내 AI 서비스 개발에 활용하기 어렵다는 단점이 있었다.

이번에 개방되는 데이터에는 한국 지역별 방언과 국내 주요도로, 국내 환자 의료영상 등이 포함된다.

이달 30일 공개될 경상·전라·충청·강원·제주 등 한국어 방언 발화 데이터는 음성기반 AI 서비스에 적용할 수 있다.

이달 18∼30일 차례로 공개되는 자율주행 데이터 21종은 국내 도로주행 영상과 주차 장애물·이동체 인지영상·버스 노선 주행영상 등을 포함해 자율주행차 개발을 앞당길 것으로 전망된다.

헬스케어 데이터 27종과 개인정보·민감정보가 포함될 우려가 있는 59종의 데이터는 최종검증을 거친 후 이달 30일에 개방한다.

개방 데이터는 스타트업이나 중소기업, 대기업 등 누구나 사용할 수 있다.

이날 과기정통부는 'AI 데이터 활용협의회' 출범식을 열고 데이터를 활용하는 기업·기관의 의견도 들었다.

AI 데이터 활용협의회는 데이터 품질관리 전문기관인 한국정보통신기술협회(TTA)와 이번 데이터 활용 검토에 참여한 기업·기관을 중심으로 구성됐다.

협의회는 AI 허브 데이터 활용 성과를 공유하고 데이터 품질 제고에 협력할 계획이다.

임혜숙 과기정통부 장관은 "댐의 물이 대지 곳곳으로 스며들어 꽃을 피우듯이 이번에 공개되는 데이터들이 산업 곳곳에서 활용돼 혁신의 열매를 맺기를 바란다"고 말했다.

연합뉴스

[과기정통부 제공. 재판매 및 DB 금지]


jungle@yna.co.kr

<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.