컨텐츠 바로가기

04.26 (금)

구글, 신경망 모델을 시각적으로 설명하는 기술, StylEx 공개

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
AI타임스

구글이 주어진 이미지에 대해 분류기(classifier)가 식별한 분류 결과에 대한 의미 있는 설명을 생성할 수 있는 새로운 기술을 도입했다.(사진=셔터스톡)

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글이 주어진 이미지에 대해 분류기(classifier)가 식별한 분류 결과에 대한 의미 있는 설명을 생성할 수 있는 새로운 기술을 도입했다.(사진=셔터스톡)구글이 주어진 이미지에 대해 분류기(classifier)가 식별한 분류 결과에 대한 의미 있는 설명을 생성할 수 있는 새로운 기술을 도입했다. 이에 따라 이전에 불투명했던 분류 프로세스에 대한 새로운 통찰력을 제공하고 과학적 발견 프로세스를 지원하는 데 핵심적인 역할을 할 전망이다.

신경망은 특정 작업을 놀라울 정도로 잘 수행할 수 있지만 어떻게 결정에 도달하는지 이해하는 것은 종종 미스터리다. 신경 모델의 의사 결정 과정을 설명하는 것은 특히 의료 이미지 분석이나 자율 주행과 같이 고위험 분야에서 특히 중요하다. 이러한 통찰력은 의료 제공자를 안내하고, 모델 편향을 밝히고, 하위 의사 결정자를 지원하고, 과학적 발견을 지원하는 데에도 도움이 될 수 있다.

Grad-CAM과 같은 분류기의 시각적 설명에 대한 접근 방식은 이미지의 어떤 영역이 분류에 영향을 미치는지 강조하지만 색이나 모양과 같은 해당 영역 내의 어떤 속성이 분류 결과를 결정하는지 설명하지 않는다. Ganalyze와 같은 방법은 GAN을 이용하여 클래스간의 이미지 변환을 통해 설명을 제공하지만 한번에 모든 속성을 변경하는 경향이 있기 때문에 영향을 미치는 개별 속성을 분리하기 어렵다.

구글에서 공개한 StylEx는 분류기를 시각적으로 설명하기 위한 새로운 접근 방식을 제안한다. StylEx는 분류기에 영향을 미치는 속성을 자동으로 발견하고 시각화한다. 속성을 개별적으로 조작하여 개별 속성의 효과를 탐색할 수 있다. StylEx는 동물, 나뭇잎, 얼굴, 망막 이미지 등 다양한 영역에 적용할 수 있다. StylEx는 의미론적 속성과 잘 일치하는 속성을 찾고, 의미 있는 이미지별 설명을 생성하며, 사람들이 해석할 수 있음을 보여준다.

AI타임스

StylEx는 분류를 설명하는 상위 K개의 속성을 제공한다. 각 노브를 움직이면 이미지의 해당 속성만 조작되고 피사체의 다른 속성은 고정된다.(사진=구글 블로그)

<이미지를 클릭하시면 크게 보실 수 있습니다>


StylEx는 분류를 설명하는 상위 K개의 속성을 제공한다. 각 노브를 움직이면 이미지의 해당 속성만 조작되고 피사체의 다른 속성은 고정된다.(사진=구글 블로그)예를 들어, 주어진 이미지에서 고양이-개 분류기를 이해하기 위해 StylEx는 연관된 속성을 자동으로 감지하고 각 속성을 조작하는 것이 분류기 확률에 어떻게 영향을 미칠 수 있는지 시각화할 수 있다. 그런 다음 사용자는 이러한 속성을 보고 그들이 나타내는 것에 대한 의미론적 해석을 할 수 있다. 예를 들어, 위의 그림에서 "개는 고양이보다 입을 벌릴 가능성이 더 높다"(위 그림의 속성 #4), "고양이의 눈동자는 좁고 기다란 틈과 비슷하다"(속성 # 5), "고양이의 귀는 접히지 않는 경향이 있다"(속성 #1), 등등.

StylEx는 분류기와 입력 이미지가 주어지면 분류에 영향을 미치는 개별 속성을 찾고 시각화하려고 한다. 이를 위해 고품질 이미지를 생성하는 것으로 알려진 StyleGAN2 아키텍처를 활용한다. 목표는 이미지의 특정 속성을 변경하여 주어진 이미지의 분류를 설명하고 이것이 분류기 출력에 영향을 미친다는 것을 보여주는 것이다.

StylEx는 생성기(Generator), 분류기(Classifier) 및 인코더(Encoder)를 동시에 훈련한다. 훈련 단계에서 입력 이미지는 인코더를 통해 잠재 벡터로 변환되어 이미지의 의미론적 속성을 포함하는 'StyleSpace'를 구성한다. 그런 다음 생성기에 의해 원본 이미지에 가까운 이미지를 생성하는 데 사용된다. 생성된 이미지와 원본 이미지 사이 및 해당 인코더 출력 사이에 분류 손실(classification loss)을 적용한다.

분류 손실을 추가해 생성된 이미지에 대한 분류기 확률이 입력 이미지에 대한 분류기 확률과 동일하도록 한다. 이렇게 하면 분류에 중요한시각적 세부 정보(예: 의료 병리)가 생성된 이미지에 포함된다. 예를 들어, 망막 이미지에 대해 훈련된 GAN은 특정 질병에 해당하는 병리를 반드시 시각화하지는 않지만 GAN 훈련 중에 GAN에 의해 ​​생성된 이미지에 분류 손실을 추가하면 병리가 생성된 이미지내에서 나타나게 된다. 이 손실은 생성기가 분류에 의미 있는 중요한 세부 사항을 무시하거나 레이블 중 하나로 축소되지 않도록 한다.

AI타임스

StylEx는 생성기(Generator), 분류기(Classifier) 및 인코더(Encoder)를 동시에 훈련한다. 시각적 유사성을 유지하기 위해 생성된 이미지와 원본 이미지 사이에 분류 손실이 적용된다. 생성된 이미지의 분류기 출력과 원본 이미지의 분류기 출력 사이에 분류 손실이 적용되어 생성기가 분류에 중요한 시각적 세부 정보를 캡처할 수 있도록 한다.(사진=구글 블로그)


StylEx는 생성기(Generator), 분류기(Classifier) 및 인코더(Encoder)를 동시에 훈련한다. 시각적 유사성을 유지하기 위해 생성된 이미지와 원본 이미지 사이에 분류 손실이 적용된다. 생성된 이미지의 분류기 출력과 원본 이미지의 분류기 출력 사이에 분류 손실이 적용되어 생성기가 분류에 중요한 시각적 세부 정보를 캡처할 수 있도록 한다.(사진=구글 블로그)훈련을 마치면 훈련된 생성기의 StyleSpace에서 분류기에 영향을 미치는 속성을 검색한다. 이를 위해 각 StyleSpace 좌표를 조작하고 분류 확률에 대한 영향을 측정한다. 주어진 이미지에 대한 분류 확률의 변화를 최대화하는 상위 K개의 속성을 제공한다. 클래스당 많은 수의 이미지에 대해 이 프로세스를 반복 하면 분류기가 특정 클래스에 대해 학습한 내용을 알려주는 상위 K개의 클래스별 속성을 추가로 발견할 수 있다.

AI타임스

일단 훈련되면 주어진 이미지의 분류 확률에 가장 큰 영향을 미치는 StyleSpace 좌표를 검색한다.(사진=구글 블로그)

<이미지를 클릭하시면 크게 보실 수 있습니다>


일단 훈련되면 주어진 이미지의 분류 확률에 가장 큰 영향을 미치는 StyleSpace 좌표를 검색한다.(사진=구글 블로그)인식된 성별 및 연령 분류기의 경우 분류기당 감지된 상위 4개 속성은 다음과 같다. StylEx는 해당 속성을 가장 잘 보여주기 위해 자동으로 선택된 여러 이미지의 각 속성을 예시한다. 각 속성에 대해 원본 이미지와 속성을 조작한 이미지 사이에서 깜박거린다. 속성 조작이 분류기 확률에 영향을 미치는 정도는 각 이미지의 왼쪽 상단 모서리에 표시된다..

AI타임스

성별 분류기에 대해 자동으로 감지된 상위 4개의 속성은 턱수염, 콧수염, 립스틱, 눈썹 두께이다.(사진=구글 블로그)

<이미지를 클릭하시면 크게 보실 수 있습니다>


성별 분류기에 대해 자동으로 감지된 상위 4개의 속성은 턱수염, 콧수염, 립스틱, 눈썹 두께이다.(사진=구글 블로그)
AI타임스

연령 분류기에 대해 자동으로 감지된 상위 4개의 속성은 피부색소침착, 눈썹 두께, 안경유무, 백발여부이다.(사진=구글 블로그)

<이미지를 클릭하시면 크게 보실 수 있습니다>


연령 분류기에 대해 자동으로 감지된 상위 4개의 속성은 피부색소침착, 눈썹 두께, 안경유무, 백발여부이다.(사진=구글 블로그)StylEx는 주어진 분류기가 데이터에서 활용하도록 학습한 이미지 속성을 나타내도록 설계되었다. 이러한 속성은 실제로 클래스 레이블(예: 더 젊거나 더 오래된 연령) 간의 실제 물리적 차이를 반드시 특성화하지 않을 수 있다. 특히, 이러한 감지된 속성은 분류기 훈련 또는 데이터 세트의 편향을 드러낼 수 있으며, 이는 우리 방법의 또 다른 주요 이점입니다. 예를 들어, 우리 방법이 드러내는 편향을 보상하는 예제로 훈련 데이터 세트를 보강함으로써 신경망의 공정성을 개선하는 데 더 사용할 수 있습니다.

AI타임스

망막 이미지의 DME(당뇨병성 황반부종) 분류기에 대해 자동으로 감지된 속성이다.(사진=구글 블로그)

<이미지를 클릭하시면 크게 보실 수 있습니다>


망막 이미지의 DME(당뇨병성 황반부종) 분류기에 대해 자동으로 감지된 속성이다.(사진=구글 블로그)
AI타임스

병들거나 건강한 잎 이미지 분류기에 대해 자동으로 감지된 속성입니다.(사진=구글 블로그)

<이미지를 클릭하시면 크게 보실 수 있습니다>


병들거나 건강한 잎 이미지 분류기에 대해 자동으로 감지된 속성입니다.(사진=구글 블로그)StylEx는 200가지 조류 종 분류기에서 입증된 바와 같이 다중 클래스 문제에도 적용할 수 있다.

AI타임스

StylEx가 200가지 조류 종 분류기에서 속성을 자동으로 감지한다.(사진=구글 블로그)


StylEx가 200가지 조류 종 분류기에서 속성을 자동으로 감지한다.(사진=구글 블로그)AI타임스 박찬 위원 cpark@aitimes.com

[관련기사]"음성·이미지·문자 한 번에" 메타, 일체형 자기학습 알고리즘 'Data2vec' 개발

[관련기사]AI로 산업재해 신속 대처…한전KDN, 'AI 영상분석시스템' 구축

Copyright ⓒ '인공지능 전문미디어' AI타임스 (http://aitimes.com)
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.