컨텐츠 바로가기

글로벌 칼럼 | 네트워크 관리 AI는 생각만큼 똑똑한가? 

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
네트워크 운영업체는 미래에는 AI가 네트워크를 관리할 것이라고 말한다. 솔루션 업체도 그렇게 말했다고 한다. 긍정적으로 말하면, 어느 정도는 사실이다. 하지만 ‘어느 정도’에 초점을 두면 부정적으로 볼 수도 있다. AI 기반 네트워크 관리에서 최대한의 효과를 얻으려면 이 애매한 ‘어느정도’ 영역에서 빠져나와야 한다. 개미와 농부의 이야기에서 그 방법을 찾을 수 있다.
ITWorld

ⓒ Getty Images Bank

<이미지를 클릭하시면 크게 보실 수 있습니다>



개미는 다양한 방식으로 터널과 층이 연결된, 놀라울 정도로 복잡한 개미집을 짓는다. 어느 탁월한 엔지니어 개미가 일개미들을 이끌어 이 과정을 지휘할까? 아니다. 각각의 개미는 본능의 지시에 따라 자신의 맡은 간단한 일에 몰두한다. 실제 엔지니어 개미도 있지만, 목표를 달성하기 위해 각 개미의 일을 구성하는 것은 개미의 DNA다. 대부분 네트워크 AI의 원리도 대체로 이와 비슷하다.

네트워크는 수많은 기술의 “컬렉션”으로 구성되며, 각 컬렉션은 개미집과 닮았다. 솔루션 업체 기반의 컬렉션, 디바이스 유형을 기반으로 하는 컬렉션, 물리적 위치, 그리고 연결 관계를 기반으로 한 컬렉션이 있다. 지금의 네트워크 AI는 대부분 컬렉션 단위로 작동한다. 네트워크 AI는 와이파이를 관리하거나 SD-WAN 또는 SASE와 같은 엣지 요소를 관리할 수 있다. 컬렉션을 관리하기 위한 AI 애플리케이션의 DNA, 즉 설계에는 관리 목표가 각인되어 있다. 와이파이 솔루션 업체라면 와이파이가 어떻게 작동하는지를 알고 있으며, 그 지식을 AI에 집어넣는다.

그런데 컬렉션을 독립적인 요소로 보기를 멈추고 네트워크를 컬렉션의 컬렉션으로 보면, 문제가 생긴다. 네트워크는 개미집이 아니라 개미집과 나무, 소, 그 외의 많은 것이 포함된 온전한 생태계다. 나무는 스스로 나무임을 알고 소는 소임을 이해하지만, 생태계를 이해하는 것은 무엇일까? 농장은 농장이다. 나무와 소와 개미집이 아무렇게나 모여 있는 곳이 아니다. 농장이 어떤 형태가 되어야 하는지를 아는 사람은 농장의 각 구성 요소나 그 요소를 공급하는 사람들이 아니라 농부다. 네트워크에서 그 농부는 네트워크 운영자다.

초기의 AI 개발자는 AI 프레임워크를 구축한 지식 엔지니어와 이 프레임워크의 형태를 정한 지식을 가진 주제 전문가의 차이를 명확하게 인지했다. 소프트웨어, 특히 데브옵스에서 관리 툴은 하나의 목표 상태를 달성하고자 한다. 농장에 비유하면 소와 나무, 개미가 각각 어디에 위치하는지를 기술한다. 현재 상태가 목표 상태가 아니면 조치를 취하거나 이것저것을 옮겨 목표를 향해 다가간다. 기업 네트워크 수준에서 필요한 것은 와이파이 전문가가 와이파이 AI 관리 툴에 잠재의식적으로 집어넣은 그 지식이다. AI 솔루션 업체가 그 지식을 얻는 방법을 모르면 이들 업체의 AI는 네트워크 관리에 도움이 되지 못한다.

그렇다고 AI에 대한 희망이 버리기는 이르다. 많은 네트워크 운영업체가 자사 네트워크를 구성하는 기술 컬렉션을 관리하는 AI에 전적으로 만족한다. 어차피 와이파이와 SD-WAN 둥 하나에 무슨 일이 생길 때 다른 하나를 조정해 문제를 해결할 수 없다면, 이 둘의 관리 조율에 대해 걱정할 필요가 무엇인가? 이 컬렉션 AI 모델이 요구사항에 부합한다면 그것으로 족하다.

개미(적어도 네트워크 AI 측면에서)가 되어도 괜찮은지 확인하는 좋은 방법은 기술 컬렉션이 정말 원자적인지, 즉 완전히 독립적이고 자립적인지를 묻는 것이다. 관건은 AI의 시야와 제어 범위다. 컬렉션별 AI는 기본적으로 단독으로 활동한다. 이상적으로는 AI 컬렉션 개미가 서로 활동을 간섭하지 않고 자신의 일을 하도록 해야 한다. 한 곳의 AI가 다른 컬렉션을 들여다보고 상태에 따라 반응하거나, 두 AI 컬렉션 프로세스가 조율 없이 동시에 같은 문제에 대해 작업하지 않도록 해야 한다.

한 컬렉션의 문제에 대한 해결책이 다른 컬렉션을 대상으로 하는 작업을 포함한다면, AI가 개입해 조율해야 한다. 따라서 생태계 문제를 관리하는 값비싸고 혹사당하는 네트워크 운영센터에서 AI가 모두에게 커피를 마실 시간을 주는지 여부가 궁금하다면, 솔루션 업체가 말하는 AI에 대해 더 깊게 통찰을 해봐야 한다.
하지만 기업에는 쉽지 않은 일이다. 필자가 올해 대화를 나눈 이들의 3/4는 내부적으로 AI 전문 지식이 많지 않거나 아예 없기 때문이다. 많은 이들은 장밋빛 약속을 하지만 정작 그 약속을 잘 이행하는 것 같지는 않은 솔루션 업체에 놀아난다고 느낀다. 기업에서 할 수 있는 일은 없는 것일까?

전체 네트워크 생태계에 AI를 제대로 사용하기 위한 가장 쉬운 방법은 오래된 “관리자의 관리자” 접근 방식과 같은 전략을 모색하는 것이다. 현대적 용어로 바꾸면, ‘의도 모델링(Intent Modeling)’이라고 할 수 있다. 기술 컬렉션 각각을 자체 SLA를 기준으로 행동을 모델링하는 블랙박스로 취급할 수 있고, AI 프로세스가 그 SLA를 강제할 수 있다면, 각 AI 툴 컬렉션이 더 높은 수준의 패키지로 장애 보고서를 생성하도록 하면 된다. 그러면 이 패키지는 단일 기술 컬렉션을 넘어서는 문제가 발생하거나 한 컬렉션이 작동을 멈춰 더 높은 수준의 수정을 고려해야 하는 경우에 무엇을 해야 할지를 결정할 수 있다.

여기서 과제는 목표 상태와 문제 발생 시 그 상태로 되돌아가는 방법을 확보하는 것이다. 앞서 언급한 주제 전문가와 지식 엔지니어 이야기를 기억하는가? 모든 네트워크는 서로 다르고, 좋거나 나쁨을 결정하는 것은 사용자이므로 하나의 AI 솔루션을 규격화하기는 어렵다. AI 툴에 따라 네트워크 운영센터 담당자의 어깨 너머로 배우는 머신러닝 기능을 제공할 수도 있고, 네크워크 솔루션 업체가 일반적인 옵션과 보편적인 해결책으로 생각하는 기준을 사용할 수도 있다.

두 접근 방법 모두 몇 가지 문제가 있다. 머신러닝에는 시간이 걸릴 수 있고, AI 시스템이 임무를 학습하는 동안 네트워크 운영센터의 리소스를 더욱 쥐어짜게 될 수 있다. 솔루션 업체의 기준선은 네트워크가 대부분 한 업체의 장비로 구성되는 경우 가장 잘 작동한다. 두 가지 모두 조율이 가능하지만 두 가지 모두 적응형 네트워크 작동에 반하여 움직일 수 있다.

IP 네트워크는 본질적으로 토폴로지 검색을 사용하고 맡은 작업을 한다. 이 라우팅에 영향을 미치는 것은 네트워크 운영센터로서도 어려운 일이다. 트래픽 엔지니어링을 위해서는 새 MPLS 경로를 계획해야 하는 경우가 많은데, AI로는 그 일을 못할 가능성이 높다. 일부 기업은 소프트웨어 정의 네트워킹(SDN)을 도입해서 중앙 라우팅 제어를 제공하는데, 그러면 AI는 SDN 컨트롤러를 제어함으로써 네트워크를 제어할 수 있다.

네트워크 운영에서 AI는 변화를 알릴 이벤트와 효과적인 대응 구현 방법의 조합으로 귀결된다. 어느 수준에서든 AI 솔루션 업체를 고려하고 있다면, 그 업체는 자사의 솔루션이 어떻게 정보를 수집하는지, 통찰력을 어떻게 구현하는지를 자세히 설명할 수 있어야 한다. 이 두 가지를 세부적으로 살펴봐야 한다. 마술 같은 AI가 할 수 있다고 주장하는 일이 무엇이든, 이 두 가지 성분이 없으면 못하기 때문이다. 개미가 아니라 농부가 되어야 한다. editor@itworld.co.kr

Tom Nolle editor@itworld.co.kr
저작권자 한국IDG & ITWorld, 무단 전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.