컨텐츠 바로가기

04.26 (금)

AWS·구글·IBM, 음성인식 넘어 영상인식 경쟁 돌입

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
클라우드 기반 인공지능(AI) 기술이 음성 인식을 넘어 영상 속 콘텐츠를 식별하는 수준까지 발전하면서, 글로벌 IT기업들의 영상 콘텐츠 검색 경쟁이 본격화 되고 있다.

IT조선

26일 IT업계에 따르면, 아마존웹서비스(AWS),구글,IBM 등 클라우드 시장을 주도하는 글로벌 IT기업들이 인공지능 기술을 활용한 새로운 영상 검색 서비스를 속속 선보이고 시장 선점에 나섰다.

아마존웹서비스(AWS)는 올해 1월 클라우드 기반의 인공지능 서비스인 '아마존 렉스', '아마존 폴리', '아마존 레코그니션'을 선보였다. 아마존 렉스는 아마존 알렉사를 활용한 서비스로, 음성 인식 기술과 자연어 처리 기술을 지원해 사람처럼 대화를 할 수 있다.

이 중 아마존 레코그니션은 이미지를 인식하는 기술로, 자동차와 같은 사물이나 특정한 장면을 구분할 수 있다. 아마존의 영상인식 기술은 강아지를 검색했을 때 어떤 견종인지 인식할 수 있는 수준까지 발전했다.

레코그니션은 AWS를 통해 이용할 수 있으며, 섬세한 라벨로 사진을 분석한 결과를 보여주는 등 고급 분석 기능도 갖췄다. 2개의 이미지를 이용해 동일인 여부를 분석해주는 얼굴 비교와 여러 이미지 중 같은 이미지만 뽑아낼 수 있다.

IBM도 26일 미국 라스베이거스에서 진행 중인 방송 기자재 전문 박람회에서 IBM 왓슨이 탑재된 클라우드 서비스 출시 계획을 밝혔다. 새로 발표한 클라우드 서비스는 인공지능 기술을 활용한 비디오 영상을 분석한 후, 원하는 정보를 끌어낼 수 있다.

어조분석(Tone Analyzer), 성격진단(Personality Insights), 자연어 이해(Natural Language Understanding), 비주얼 이미지 인식(Visual Recognition) 기능을 갖춘 이 서비스는 올해말 출시될 예정으로, API(Application Program Interface)도 함께 공개한다.

IBM 리서치 기술을 이용해 왓슨이 생성한 데이터를 분석하고, 영상 콘텐츠의 의미를 파악해 비디오를 논리적 장면으로 분류할 수 있다. 이 기능은 현재 시장의 제품이 제공되는 것 이상으로 콘텐츠와 맥락을 심층적으로 이해해서 장면을 식별할 수 있다.

구글은 지난달 미국 샌프란시스코에서 진행한 '클라우드 넥스트 콘퍼런스'에서 비디오를 자동으로 인식하고 검색할 수 있는 머신러닝 기술인 '클라우드 비디오 지능(Cloud Video Intelligence)' API(베타 버전)를 공개했다.

현재 자동영상사물인식 기술은 영상 속의 개나 고양이를 구분할 수 있고, 태그 없이도 특정 키워드가 담긴 영상물을 찾아낼 수 있다. 그동안 비디오 검색은 사람이 일일이 검색어를 태그처럼 달아줘야만 검색엔진이 찾을 수 있었다. 심지어 태그를 달아도 정확하게 원하는 영상을 찾는게 쉽지 않았다.

클라우드 비디오 지능 기술을 유튜브 동영상에 적용하면 10억개 이상의 동영상 중 특정 물체를 검색하는 게 가능해진다.

스티브 카네파 IBM 미디어 및 엔터테인먼트산업 총괄은 "기업들은 변화하는 시청패턴에 대응하기 위해 콘텐츠 개발 및 제공 방식을 바꿔야 할 필요성이 매우 커졌다"며 "기업들이 심층적인 인사이트를 찾아내고, 콘텐츠를 다른 시각으로 바라보고, 보다 현명한 의사결정을 할 수 있는 새로운 인지 솔루션 경쟁이 본격화 되고 있다"고 말했다.

IT조선 김남규 기자 nicekim@chosunbiz.com
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.