컨텐츠 바로가기

04.25 (목)

[Science &] 지구최강 AI 슈퍼컴퓨터 전쟁 불붙었다

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
매일경제

<이미지를 클릭하시면 크게 보실 수 있습니다>


미국이 다시 슈퍼컴퓨터 세계 1위 왕좌를 탈환했다. 2013년 6월 세계에서 가장 빠른 슈퍼컴퓨터 보유국 지위를 중국에 뺏긴 지 5년 만이다. 슈퍼컴퓨터가 국가 과학기술 수준을 보여주는 상징이 되면서 G2(미국·중국) 간 최고자리를 차지하기 위한 경쟁이 치열하게 전개되고 있다. 각종 첨단기술 집약체인 슈퍼컴퓨터 활용 분야는 우주 탐사, 해킹이나 테러 위협 예방, 항공기 비행과 충돌 시뮬레이션, 암 치료제 등 신약 개발, 경기와 주가 예측 등 무궁무진하다. 슈퍼컴퓨터는 경제 정책 수립에도 활용될 수 있다. 미국 연방준비은행 연구자들은 2014년 주어진 세율에 대해 각 가구가 어떤 반응을 보이는지에 대한 수학적 모형을 만든 뒤 슈퍼컴퓨터로 미국 수백만 가구 케이스를 빠르게 계산해 최적 세율 53%를 뽑아낸 바 있다. 최근에는 바이오 분야 활용도 늘어나는 추세다. 신약을 개발하기 위해서는 단백질을 구성하는 수십만 개 분자 행동을 일일이 파악해야 하는데 분자 움직임을 예측하는 물리학 공식을 슈퍼컴퓨터로 계산하면 경우의 수를 미리 알아내 치매, 파킨슨병 등 퇴행성 뇌 질환부터 당뇨, 암에 이르는 각종 질병에 대한 원자 수준의 치료법을 찾아낼 수 있다.

슈퍼컴퓨터란 연산속도가 세계에서 가장 빠른 순으로 랭킹 500위 안에 드는 컴퓨터를 말한다. 이처럼 슈퍼컴퓨터는 오로지 대규모 연산을 초고속으로 수행하는 데 최적화돼 있다. 매년 6월과 11월 국제 슈퍼컴퓨팅 콘퍼런스(ISC)에서 이 같은 연산속도 순위가 업데이트되는데 올해 결과는 오는 24일 베일을 벗는다. 그런데 지난 9일 미국 대표 정보기술(IT) 기업인 IBM이 미국 테네시주 오크리지 국립연구소에 설치한 슈퍼컴퓨터 '서밋'의 연산 속도가 207페타플롭스(PFlops·1PFlops는 1초에 1000조번 연산)에 달한다고 밝히면서 올해 순위 지각변동을 예고했다. 초당 20경의 연산을 처리하는 서밋의 성능이 직전 최강자였던 중국 슈퍼컴퓨터 '선웨이 타이후즈광(太湖之光)'의 연산속도를 두 배 가까이 앞지르게 된 것이다. 선웨이 타이후즈광의 연산 속도는 정점일 때 125페타플롭스로 초당 최대 12경5000조 정도의 계산을 처리한다.

박찬열 한국과학기술정보연구원(KISTI) 슈퍼컴퓨팅개발센터장은 "슈퍼컴퓨터는 워낙 여러 기술의 복합체라 속도를 높이기 위해 다양한 시도를 하는 과정에서 기존에 적용되지 않았던 신기술이 접목되기도 하면서 엄청난 혁신을 몰고 온다"며 "국가 간 기싸움도 없지는 않겠지만 슈퍼컴퓨터 경쟁에서 주도권을 쥔다는 것은 그야말로 첨단기술을 선도한다는 지표로 활용될 수 있다"고 설명했다. 특히 슈퍼컴퓨터에서 시작된 혁신이 향후 PC나 휴대폰 등 일상 곳곳으로 파급될 수 있고 다수의 이용자가 원격지에서 공동으로 슈퍼컴퓨터를 활용해 더 빠른 속도로 정보를 확보할 수 있기 때문에 더 중요하다는 게 박 연구원의 설명이다.

매일경제

작년까지는 '과학 굴기'를 부르짖는 중국의 약진이 뚜렷했다. 선웨이 타이후즈광이 2년 연속 랭킹 1위를 굳건히 지켰을 뿐 아니라 상위 500위 슈퍼컴퓨터 중 가장 많은 202대가 중국 소유로 집계돼 미국(143대)을 큰 차이로 제쳤다. 이 때문에 올해 서밋의 등장은 미국의 짓밟힌 자존심을 회복한다는 의미가 크다. 일반 데스크톱으로 30년간 작업할 분량을 단 1시간에 끝내고 앞선 미국의 대표 슈퍼컴퓨터 '타이탄'의 이론성능 27페타플롭스의 약 8배 빠르기를 자랑한다는 서밋. 어떻게 단기간에 이 같은 속도의 혁신이 가능해진 걸까.

슈퍼컴퓨터의 머리 역할을 하는 중앙처리장치(CPU)를 대신해 이미지처리장치(GPU)를 많이 장착한 게 바로 서밋 성능의 비결이다. 2010년 전까지는 슈퍼컴퓨터에 CPU를 주로 사용했고 각국은 CPU 성능을 높이는 데 집중됐다. CPU가 사람의 '머리'라면 코어는 사람의 '뇌'인데 뇌를 머리에 최대한 많이 달아 계산을 빠르게 하려는 시도가 이어졌다. 선웨이 타이후즈광에는 코어가 1000만개나 장착됐을 정도다. 또 한 대의 CPU 성능을 높이는 데 한계에 부딪치자 병렬 처리 방법으로 여러 대의 CPU를 연결하는 경쟁이 격화됐다. 그러나 무조건 '다다익선'은 아니었다. 코어 수가 기하급수적으로 늘어나면서 엄청난 양의 전기가 필요해졌고 발열 등 새로운 문제점이 나타났다. 결국 2010년을 넘어가면서부터 CPU 대안으로 등장한 게 보다 값싸고 효율적인 GPU다. 주로 이미지 데이터 처리에 쓰이던 프로세서를 슈퍼컴퓨터에 적용함으로써 범용 계산에 이용하기 시작한 것이다.

박 센터장은 "슈퍼컴퓨터의 가장 큰 문제 중 하나가 전력 소모였는데 서밋은 에너지를 덜 먹는 GPU를 과거에 비해 많이 집어넣어 성능뿐만 아니라 전력 효율을 높였다"며 "GPU는 그래픽처럼 조금은 단순한 연산을 대량으로 할 수 있기 때문에 속도를 높이는 데 효과가 있다"고 말했다. 서밋은 강력한 연산 능력을 발휘하기 위해 CPU와 GPU를 모두 사용했다. IBM 최신 서버용 CPU인 '파워9' 9216개와 엔비디아가 개발한 볼타 V100 기반의 GPU 2만7648개가 들어갔다. 연산은 GPU가 하고 CPU는 이런 연산을 통제·관리하는 구조다. 총 무게만 340t이고 크기는 테니스 코트 두 개와 맞먹는다. 물론 여전히 열을 식히기 위해 분당 1만5000ℓ의 물을 사용하고 정점일 때 전력 소비량은 7000가구에 전원을 공급할 수 있는 약 15메가와트에 달하지만 이전 모델들에 비해서는 효율도가 많이 높아진 것이다.

슈퍼컴퓨터가 인공지능(AI)과의 접점을 늘려간다는 점도 괄목할 만한 변화다. 그동안 GPU는 주로 머신러닝(기계학습) 연산이나 비트코인 같은 가상화폐 채굴에 쓰여 왔다. 가령 이세돌 9단을 꺾은 알파고 머릿속도 역시 GPU를 병렬 처리해 연결한 구조로 돼 있다. 이런 GPU를 많이 장착한 결과 서밋은 일반 연산뿐 아니라 AI 연산을 훨씬 빠르게 수행할 수 있게 됐다. 현시점에서는 '지구에서 가장 강력한 AI 컴퓨터'라는 얘기다. IBM의 고성능 컴퓨팅 인지시스템 담당 부사장 데이브 튜렉은 "시장이 AI와 고성능 컴퓨팅이 별도 영역에 존재하는 게 아니라 통합될 수 있다는 것을 인식하기 시작했다"며 "머신러닝 기술을 통합하면 최적의 결과를 얻기 위해 수행해야 하는 시뮬레이션 양을 크게 줄일 수 있다"고 말했다.

글로벌 슈퍼컴퓨터 전쟁은 서밋으로 되찾은 우위를 놓지 않으려는 미국과 선두를 되찾으려는 중국의 도전으로 점점 더 치열해질 전망이다. 미국은 2021년까지 엑사플롭스(ExaFlops·1초에 100경번 연산) 수준의 속도를 구현할 컴퓨터를 만든다는 목표로 개발에 앞장서고 있다. 중국 역시 정부의 전폭적인 지원으로 후속 모델을 개발 중이다. 선웨이 타이후즈광의 경우 이미 외부 도움 없이 스스로 개발한 CPU를 장착해 모든 부품을 국산화하는 데도 성공했다. 기기만 중국 소유고 머릿속은 모두 미국산으로 이뤄졌다는 한계까지 극복한 것이다. 다만 하드웨어에 비해 소프트웨어 부분은 아직 미국에 한 발 뒤처진다는 지적은 여전하다. 중국과학원 컴퓨터과학 국가중점연구실의 차오지엔원 연구원은 "중국이 빠른 슈퍼컴퓨터를 보유해 좋은 토대를 닦은 것은 맞지만 어떻게 그 사용 효과를 극대화할 수 있는지 아는 데는 10년이라는 시간이 더 걸릴 수 있다"고 실토했다.

한때 글로벌 1위였다가 지난해 말 현재 4위로 밀려난 일본은 슈퍼컴퓨터 개발에 올인한 상태다. 교우코우 슈퍼컴퓨터는 기기가 뿜어낸 열을 절연성 액체에 담가 식히는 방법으로 에너지를 절약해 효율과 친환경 측면에서는 세계 최고 수준으로 평가 받고 있다.

오는 24일 랭킹공개
9년만의 업그레이드…한국 슈퍼컴 '5호기' 글로벌 톱10 노린다


오는 24일 국제 슈퍼컴퓨팅 콘퍼런스(ISC)에서 정확한 사양, 전력 소모량과 함께 글로벌 랭킹이 공개될 한국의 국가 슈퍼컴퓨터 5호기는 다음달 1일부터 파일럿시스템 시범서비스를 시작한다. 슈퍼컴퓨터 5호기는 한국과학기술정보연구원(KISTI)이 2017년 9월부터 약 525억원의 예산을 투입해 구축하기 시작한 대용량 컴퓨터다. 현재 정식 명칭에 대한 공모가 진행 중이다. 국가 슈퍼컴퓨터가 교체되는 것은 9년 만에 처음이다. 조민수 KISTI 슈퍼컴퓨팅서비스센터장은 "7월 1일부터 시작되는 시범 가동은 과거 시스템에서 새로운 시스템으로의 이전을 수월하게 하기 위한 과도기 단계로, 정식 프로젝트나 문제 해결에 활용되기까지는 시간이 더 걸린다"며 "제조사인 미국 CRAY로부터 슈퍼컴퓨터를 완전히 넘겨받기 위해 안전성 테스트 등 마지막 성능시험과 검수를 진행하고 있다"고 설명했다.

성능은 기존 4호기의 80배로 연산 속도가 이론적으로 최대 25.7PFlops(페타플롭스·1PFlops는 1초에 1000조번 연산)에 달한다. 70억명이 하루 24시간을 꼬박 투자해도 420년이나 걸리는 계산을 단 1시간 만에 끝낼 수 있는 연산 능력을 갖춘 셈이다. 세계 8위 수준의 미국 슈퍼컴퓨터 '코리', 세계 9위 수준의 일본 슈퍼컴퓨터 '오크포리스트 팩스'와 비슷한 수준으로 점쳐진다. 전문가들은 지난해 11월 현재 기준으로 슈퍼컴퓨터 5호기가 세계 10위 안에 드는 연산 속도를 자랑하지만 국가 간 순위 경쟁이 너무 치열한 상황에서 실제로 10위권 안에 들 수 있을지는 뚜껑을 열어봐야 알 수 있을 전망이다. 다만 9년 전 도입 당시 세계 14위였던 슈퍼컴퓨터 4호기가 500위 밖이었다는 점을 감안하면 크게 격차를 따라잡은 모습이다.

한국 슈퍼컴퓨터 5호기의 가장 큰 경쟁력은 바로 '버스트 버퍼' 시스템이다. 하드웨어는 미국 제조사 기기를 그대로 도입했기 때문에 큰 차이가 없지만 대용량 저장장치 외에 추가로 1PB(페타바이트·1PB는 고화질 영화 20만편 분량)의 초고속 저장장치를 설치해 검색과 자료 저장에 동반되는 '버퍼링'을 크게 줄일 수 있을 것으로 기대를 모으고 있다. 5호기의 하드디스크 용량은 20PB에 달하는데 이런 대용량 자료를 일일이 검색하고 저장하는 데 걸리는 시간을 단축할 수 있게 된 것이다. 조 센터장은 "전체 성능이 20페타플롭스가 넘는다 하더라도 메모리가 적거나 하면 메모리와 프로세서가 정보를 주고받는 과정에서 병목 현상이 생길 수 있는데 이런 병목을 완화해주는 장치가 버스트 버퍼"라며 "10차로 도로가 있어도 톨게이트가 하나밖에 없으면 교통 체증이 생기듯 어딘가 문제가 생겼을 때 막힘을 뚫어주고 데이터를 빠르게 업로드해주는 역할"이라고 설명했다.

슈퍼컴퓨터 규모는 계속 커지고 있다. 1988년 도입한 1호기는 커다란 캐비닛 정도였던 데 비해 2호기는 작은 방 하나, 3호기는 넓은 방 하나 크기가 됐다. 4호기는 건물 두 개 층을 거의 다 사용했고 5호기는 아예 전용 건물에서 운영된다. KISTI는 수년 전부터 본관 건물 옆에 슈퍼컴퓨터 전용 건물로 연면적 7780㎡ 규모의 '슈퍼컴퓨팅센터 복합지원동'을 건립했다. 연간 총유지비는 40억원가량으로 전기요금만 약 25억원에 달한다.

[김윤진 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.