컨텐츠 바로가기

09.15 (일)

집중력, 집요함, 세밀한 분석…발달장애인 장점이 AI 데이터 생산성 높여

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
한겨레

자율 주행용 학습 데이터 가공 프로그램 화면. 유튜브 갈무리

<이미지를 클릭하시면 크게 보실 수 있습니다>


“좋은 데이터를 수집하고 가공하는 것이 인공지능을 만드는 과정의 80%를 차지한다.”



인공지능(AI) 분야의 세계적 석학인 앤드류 응(Andrew Ng) 스탠퍼드대학교 겸임교수의 말이다. 사람이 경험에 기초해 사고하는 것처럼, 인공지능 역시 사람들이 만들어 낸 데이터에 기반을 둬 사고하고 연상한다. 결국 안전하면서도 품질 좋은 인공지능 학습 데이터를 확보하는 것이 인공지능의 성능을 좌우한다. 특히, 최근 생성형 인공지능 서비스가 급격히 성장함에 따라 ‘데이터 라벨링(분류)' 산업도 빠르게 부상하고 있다.



‘데이터 라벨링’은 문서, 사진, 음성, 영상 등 다양한 데이터를 분류한 뒤 주석을 달아 인공지능 학습에 필요한 정보를 제공하는 작업이다. 과거에는 ‘디지털 시대의 인형 눈알 붙이기'로 불리는 노동집약적인 단순 작업으로 여겨졌다. 하지만 최근 인공지능 학습 데이터 수요가 급증하면서 주요 산업으로 자리 잡고 있다. 한국수출입은행에 따르면 글로벌 인공지능 학습 데이터 라벨링 시장 규모는 2021년 10조8천억원에서 4년만인 2025년 39조4천억원으로 세 배 이상 커질 것으로 예상한다.



데이터 라벨링 기업들은 주로 크라우드소싱(crowd sourcing, 개방형 대중참여) 방식을 통해 대규모 인력을 모집해 작업을 진행한다. 이렇게 모은 데이터를 기업에 판매하는 방식으로 운영된다. 결국 인공지능의 기반은 ‘사람의 노동’인 셈이다. 최근엔 기술 발전으로 인공지능이 스스로 ‘데이터 라벨링’ 작업을 학습하고, 일부 단순 작업을 자동화하는 단계에 이르렀다.







기술적 강점을 앞세운 소셜벤처





2015년 6월 설립한 ‘테스트웍스(TESTWORKS)’는 이 분야에서 두각을 나타내는 기업 중 하나다. 이 회사는 자율 주행용 데이터 가공을 비롯해 헬스케어·스마트 팩토리∙스마트 농업 등 다양한 산업 분야에서 인공지능 학습 데이터 구축 사업을 수행하고 있다. 고객이 개발하고자 하는 인공지능 알고리즘에 최적화된 데이터 형태를 컨설팅하고 학습 데이터 구축의 전 과정을 포괄하는 원스톱 서비스를 제공하는 것이 사업 모델의 핵심이다.



테스트웍스의 주요 솔루션으로는 △데이터를 실시간으로 판별해 수집하고 검수하는 ‘에지 인공지능(Edge AI)’ △크라우드소싱 기반의 데이터 수집 및 라벨링 플랫폼 ‘에이아이웍스(aiworks)’ △데이터 라벨링 자동화 및 작업 관리와 모니터링 솔루션 ‘블랙올리브(blackolive)’ 등이 있다. 이 밖에도 대규모 학습 데이터 구축 경험과 검증 역량을 바탕으로 자체 개발한 인공지능 데이터 품질 검증 도구(ADQ, AI Data Quality)를 보유하고 있으며, 한국인정기구(KOLAS) 공인시험기관으로 소프트웨어 시험 성적서 및 인공지능 데이터와 모델의 시험 결과서 발급 서비스를 제공하고 있다. 고객의 요구에 맞춰 이미지, 오디오, 텍스트 등 다양한 형태의 원천 데이터를 수집하고, 이렇게 수집된 정형·비정형 데이터를 학습 가능한 형태로 라벨링하고 검증한다. 인공지능 도입을 위해 데이터 서비스를 요청하는 고객사들은 높은 수준의 세분화된 데이터를 필요로 한다. 테스트웍스는 이러한 요구를 충족시키기 위해 자동화와 내부 전문가 및 숙련된 외부 인력의 검수를 결합한 시스템을 구축해 높은 품질의 데이터셋을 제공하는 것을 핵심역량으로 삼고 있다. 이로 인해 국내외 고객사로부터 높은 평가를 받고 있으며, 재계약률이 87.5%에 이를 만큼 대규모 장기 프로젝트를 지속해서 수행하고 있다.



한겨레

테스트웍스는 인공지능 학습 데이터 구축의 전 과정을 포괄하는 원스톱 솔루션을 제공하고 있다. 자료: 테스트웍스 누리집

<이미지를 클릭하시면 크게 보실 수 있습니다>




포용적 고용 “기술과 사람을 잇다”





기술적 강점을 갖고 있으면서도 테스트웍스가 다른 ‘데이터 라벨링’ 기업들과 크게 구별되는 점이 하나 있다. 지난 2017년 사회적기업 인증은 받은 테스트웍스는 장애인 등 취약계층을 적극 고용하며 ’포용적 고용 모델’을 실천하고 있다. 지난 8월 기준, 전체 직원 180명 가운데 청각장애인·발달장애인(자폐스펙트럼장애)·경력보유여성 등 이른바 ’취업 취약계층’에 속하는 직원이 38명에 이른다.



테스트웍스는 단순히 취약계층에게 일자리를 제공하는 사회적기업의 ’시혜적’ 모델과는 다르다. 실제 장애인 직원들도 다른 직원들과 마찬가지로 생산성을 충분히 발휘하고 있다. 반복 작업에 대한 높은 집중력과 정확성에 필요한 집요함을 지닌 발달장애인, 시각 정보를 세밀하게 분석하는 능력이 뛰어난 청각장애인, 우수한 소통(커뮤니케이션) 역량과 강한 책임감을 가진 경력보유여성 등, 이들은 단순 노동을 넘어 인공지능 학습 데이터 구축의 주요 업무에 적극적으로 참여하고 있다. 회사는 이들의 특성을 고려한 맞춤형 직무 설계를 통해서 높은 생산성을 유지하고 있다.



테스트웍스는 인공지능 데이터 분야에서 포용적 고용 창출 공로를 인정받아 지난 2021년과 2022년 2년 연속으로 대통령 표창을 받았다. 지난해엔 약 50억 원의 투자를 받았다.



윤석원 테스트웍스 대표는 “사회적 취약계층에게 공정한 기회를 제공하고, 이들이 자신의 능력을 발휘할 수 있어야 오래 일할 수 있다”며, “반복적이고 세밀하며 정확해야 하는 인공지능 데이터 전처리 업무가 발달장애인의 특성과 잘 맞을 것이라고 믿었다”고 설명했다. 그는 이들을 위한 최적화된 작업 공정(프로세스)을 구축하고, 이로써 품질 높은 데이터셋(데이터 집합)을 제공할 수 있었다고 덧붙였다.



윤 대표는 테스트웍스의 운영이 고차방정식을 푸는 것과 유사한 일이라고 했다. 회사 설립 배경부터 남달랐다. 텍스트웍스는 인공지능이 뜰 것 같아 만든 회사가 아니라, 발달장애인이 잘할 수 있는 직무 영역을 찾다가 만들게 된 회사다. 하지만 지속 가능하게 하려면 돈을 벌어야 했다. 그는 “결국 모든 직원이 제대로 된 생산성을 내면서 이윤을 창출할 수 있는 비즈니스 모델을 찾아내고, 현실화하는 것이 관건이었다”고 말했다.



한겨레

수어 영상 데이터셋 활용해 청각장애인 수어 소통 지원하는 택시. 유튜브 갈무리

<이미지를 클릭하시면 크게 보실 수 있습니다>




인공지능 생태계에 사회적 가치를 불어넣다





이렇게 만들어진 테스트웍스의 성공은 단순히 사업적·기술적 성과에 그치지 않는다. 사회적 가치를 실현하는 데에도 크게 기여하고 있다. 창업자인 윤 대표는 “테스트웍스는 취약계층에게도 공정한 기회를 제공하고, 기술을 활용해 ’선한 사회’를 만들기 위해 설립한 사회적기업이자 소셜 벤처”라고 말한다. 이 회사는 취약계층의 취업만이 아니라 청각·시각 장애인 문제를 비롯한 다양한 사회 문제 해결을 위한 인공지능 학습 데이터셋 구축 프로젝트에도 적극적으로 참여해왔다.



지난 23일 경기도 수원컨벤션센터에서 열린 ‘2024 경기 사회적 경제 박람회’에 연사로 참석한 윤 대표는 이동 취약계층을 위해 인도 보행 데이터를 가공하고, 청각장애인을 위한 수어 영상용 인공지능 학습 데이터셋 구축 사례를 발표했다. 또한 인공지능 그림 생성 도구를 교육 플랫폼으로 구현해 발달장애인에게 예술 교육을 진행한 ‘경기도 인공지능 창작단’ 사례도 소개했다.



윤 대표는 “수어 영상을 인공지능 데이터로 구축하는 과제에서 우수한 품질을 지켜내기 위해 자체 비용까지 추가로 쏟아부으며 정성을 다했다. 그 결과 좋은 평판을 쌓으며 국내 주요 고객사를 확보할 수 있었다”고 설명했다. 테스트웍스는 이러한 수어 영상 인공지능 데이터셋을 활용해 청각장애인 기사가 운행하는 호출형 차량 공유 서비스 ‘고요한 엠(M)’과 협력해 청각장애인을 위한 수어 안내 시범 서비스를 제공하기도 했다. 청각장애인 승객이 택시에 탑승해 단말기를 통해 목적지를 수어로 전달하고, 운전자와 소통할 수 있도록 지원하는 서비스다.



‘인도 보행 영상 데이터셋 구축사업'은 장애인의 이동권을 확장하기 위한 인공지능 서비스 개발의 기반을 마련한 프로젝트다. 이 사업은 장애인 보행에 위협이 되는 각종 장애물(자동차, 사람, 가로등, 가로수 등)과 위험한 보행 노면에 대한 데이터를 수집해 인공지능 시스템을 위한 데이터셋을 구축하는 것을 목표로 하고 있다.



한겨레

서울 송파구에 위치한 데이터 라벨링 회사 데스트웍스는 인공지능이 뜰 것 같아 만들어진 회사가 아니라 발달장애인이 잘 할 수 있는 직무를 찾다 만들어진 독특한 창업 배경을 가진 회사다. 이 회사의 윤석원 대표(사진)는 인공지능과 사회적 가치를 연결시켰다는 평가를 받는다.

<이미지를 클릭하시면 크게 보실 수 있습니다>




대기업 연구원이 소셜벤처 사회적 기업가로 전향한 이유





윤 대표는 미국에서 컴퓨터 과학을 전공한 뒤 마이크로소프트(MS)에서 시니어 소프트웨어 엔지니어로 일했다. 삼성전자에서 반도체 총괄 수석연구원으로 근무하며 이름을 날렸던 개발자다. 그러나 그는 안정적인 대기업 연구원 자리에서 벗어나 소셜 벤처를 창업하며 사회적 기업가로의 길을 선택했다.



그가 소셜 벤처를 창업하게 된 계기는 2008년 마이크로소프트 근무 시절로 거슬러 올라간다. 당시 사회공헌 활동으로 탈북 청년에게 소프트웨어 테스팅을 가르칠 기회를 얻었고, 그의 변화 과정을 지켜보며 자신의 전문성이 사회적 약자에게 큰 도움이 될 수 있음을 깨달았다. 그 뒤 어느 날 통근 버스를 타고 가다가 사표를 내기로 결심했고, 자신이 추구하는 가치를 좇아 삶의 방향을 바꿨다. 이후 경력단절 여성과 장애인을 데이터 관련 정규직으로 고용하는 사업 모델을 구축하기 시작해 오늘에 이르렀다.



지난 27일 서울 송파구의 테스트웍스 사무실에서 한겨레와 한 인터뷰에서 그는 “선한 영향력으로 존경받는 임팩트 유니콘이 되는 것”을 목표로 “비즈니스를 정비해 제2의 도약을 준비하고 있다”고 말했다. 취약계층에게 새로운 삶의 기회를 열어주고, 선한 사회를 만들어가는 기술 기업으로서 제2의 도약을 꿈꾼다.



글∙사진 조현경 한겨레경제사회연구원 연구위원 gobogi@hani.co.kr



한겨레

포용적 고용 창출 공로로 2021~22년 대통령 표창. 조현경 연구위원

<이미지를 클릭하시면 크게 보실 수 있습니다>




한겨레

지난해 베트남 지사 직원들 단체 사진. 테스트웍스 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>




한겨레

윤석원 테스트웍스 대표. 테스트웍스 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>




▶‘딥페이크’와 ‘N번방’ 진화하는 사이버 지옥 [더 보기]
▶▶한겨레 뉴스레터 모아보기▶▶행운을 높이는 오늘의 운세, 타로, 메뉴 추천 [확인하기]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.