컨텐츠 바로가기

12.26 (목)

이슈 인공지능 시대가 열린다

SKT, 뜨거운 AI서버 기름에 넣어 전력 사용 37%↓

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
SK텔레콤은 각종 서버를 전기가 통하지 않는 특수 냉각유(油) 속에 넣어 냉각하는 차세대 열관리 방식인 ‘액침냉각’ 기술 검증에 성공했다고 14일 밝혔다.

생성형 인공지능(AI) 경쟁에 따라 고전력 GPU 서버 구축이 급증하며 일반서버(x86) 대비 수십 배 소모 전력이 높은 GPU 서버의 냉방이 중요한 이슈로 부각되고 있다. GPU 서버 냉각에만 데이터센터 전기 사용량의 40% 가까이 소모하는 상황이다.
아시아경제

SKT 직원들이 액침냉각 시스템을 점검하는 모습 [사진제공=SKT]

<이미지를 클릭하시면 크게 보실 수 있습니다>


SKT는 액침 냉각 전문회사인 미국 GRC의 설비와 다양한 제조사의 테스트용 서버, SK엔무브의 특수냉각유(Thermal Fluids, ZIC-GC2)로 자사 인천 사옥에 액침 냉각 시스템을 구축하고 지난 6월부터 4개월간 테스트를 진행했다. 그 결과, 기존 공기냉각 대비 냉방 전력의 93%, 서버 전력에서 10% 이상이 절감돼 총 전력 37%가 절감되는 효과를 확인했다.

SKT가 이번에 검증에 성공한 액침 냉각 시스템은 차가운 공기를 순환시키거나 팬을 통해 냉각하는 기존 공랭식 시스템과 달리 전기는 통하지 않고 열전도는 높은 특수 냉각유에 서버를 직접 담가 냉각하는 유냉식 시스템이다. 공기보다 열전도가 훨씬 높은 특수 냉각유를 사용해 직접 서버 장비의 열을 흡수하고, 공기냉각에 필요했던 서버의 송풍기를 제거해 냉각 뿐 아니라 서버의 전력 절감도 가능하다. 서버의 주요 고장 원인인 습도, 먼지, 소음에도 자유로워 서버 수명 연장도 기대되며, 서버 내부의 발열체인 CPU, GPU뿐만 아니라 메모리, 저장장치 등 시스템 전체의 온도를 안정적으로 유지할 수 있어 고온으로 인한 장비의 고장 원인도 줄일 수 있다.

공기냉각 방식과 액침 냉각 방식에서 각각 서버의 성능 테스트를 수행한 결과 성능에도 차이가 없었다. 같은 성능테스트 결과 대비 액침 냉각에서 서버 전력 절감이 확인되어 전성비(전력 대비 성능 비율)가 좋아짐을 확인할 수 있었다.

SKT는 작년 8월 GRC사의 액침 냉각 시스템을 10년 넘게 성공적으로 운용 중인 미국 내 레퍼런스 사이트를 직접 방문해 액침냉각 시스템의 성능과 지속 가능성을 확인했다. 올해 4월 자사 인천 사옥에 액침냉각 테스트 설비 및 성능·효율 분석 시스템을 구축했으며, 6월부터 액침 냉각 시스템의 성능, 안정성, 운영 모니터링 방안 및 비용 효율 등을 검증해 만족할 만한 결과를 확인했다.

SKT는 자사 AI 서비스를 위한 전용 데이터센터를 오는 11월 인천 사옥에 구축할 예정이며, 액침 냉각 시스템은 내년 중 인천 사옥에 본격 적용할 계획이다.

액침 냉각 방식은 오래전부터 제안됐지만 널리 사용되지 못했다. 2020년부터 AI, 가상화폐 채굴 등을 목적으로 하는 해외 데이터센터에서 일부 사용 중이다. 하지만 최근 GPU 서버 시스템 발열량이 지속 증가함에 따라 데이터센터 에너지 소비량이 빠르게 늘어나면서 구글, MS, 인텔 같은 빅테크 기업들도 액침 냉각 도입을 검토하고 있다. 코 로케이션(Co-location·인터넷 서비스 제공사가 초고속 인터넷망에 서버를 연결해 주고 관리하는 사업 형태) 서비스 제공업체인 미국의 이퀴닉스(Equinix)나 헝가리의 디지털 리얼리티(Digital reality) 등도 이미 액침 냉각 시스템에 대한 검토와 실증을 끝낸 것으로 알려져 있다.

최근 CPU 디자인이 여러 개의 칩렛(Chiplet)을 연결해 큰 칩으로 만드는 방식으로 바뀌면서 전력 소모도 늘어나, 인텔은 공냉 방식의 쿨러로는 감당하기 힘든 상황에 직면하면서 액침 냉각 시스템 도입을 추진하고 있다. 인텔은 2021년 8월 액침 냉각 기술 개발을 위해 이 분야 선두 기업인 스페인의 서브머(Submer)와 협력을 발표하였으며, 2022년 1월에는 AI를 위한 고성능 컴퓨팅(HPC, High Performance Computing) 부분에 액침 냉각 시스템을 도입하기 위해 전문 기업인 GRC와 파트너십을 체결했다.

SKT가 도입한 솔루션 기업인 GRC는 2009년 설립돼 미국 오스틴(Austin)에 본사와 연구소를 두고 있는 기업으로 25개 이상 글로벌 특허를 보유하고 있다. 특히 엔비디아, 인텔, 델, HPE, SGI 등 글로벌 기업들을 고객사로 확보하고 다양한 기술협력을 하고 있어 실증 결과를 중시하는 국내 기업들에 가장 적합한 액침 냉각 시스템사로 평가받고 있다.

또한, SK엔무브는 지난해 GRC에 2500만달러 투자를 단행했으며, GRC, 델 테크놀로지스와 업무협약을 체결하여 데이터센터 액침 냉각 시스템 수요 확대를 위한 기술개발과 사후관리(AS) 시장 구축에 나섰다. 또 SKT의 액침 냉각 실증 및 검토에도 참여해 성공적인 결과 도출에 기여했다.

데이터센터 에너지 절감은 서버 외 가장 큰 전력을 사용하고 있는 냉각 설비를 얼마나 효율적으로 구성하는 것에 달려있다. 이를 수치화한 것이 전력효율지수(PUE, Power Usage Effectiveness)로 데이터센터의 총 전력량을 IT장비 전력량으로 나눈 값이며 1에 가까울수록 전력효율이 좋은 데이터센터로 평가받는다.

공기냉각 방식의 최신 데이터센터 PUE는 약 1.5이며, PUE를 낮추기 위해 겨울철 차가운 외부 냉기를 끌어오거나 저전력 고효율 설비를 구축하는 등 다양한 시도를 하고 있다. 하지만, 공기냉각의 기술 발전에도 불구하고 설치 및 냉각에 필요한 공간 문제와 여전히 큰 에너지 소비 및 비용 문제가 남아 있으며, 갈수록 늘어나고 있는 전력 사용량을 줄이기 위해서는 데이터센터 냉각시스템 효율화가 절실한 실
국제에너지기구(IEA)에 따르면, 2022년 전 세계 데이터센터 전력 소비 추정치는 240~340TWh로, 이는 국내 연간 전력 소비량의 42~60%에 해당할 만큼 막대한 양이다.

SKT는 이번 국내 최초의 액침 냉각 시스템 구축 및 성공적인 검증을 통해 입증된 데이터센터 모니터링 솔루션을 SK엔무브의 열관리 사업과 결합해 액침 냉각 사업에 본격 나설 계획이다. 향후 액침 냉각 기술 보급을 주도해 데이터센터 전력 절감을 통한 넷제로 달성에 기여할 수 있을 것으로 기대하고 있다.

조동환 SKT CIO(부사장)은 “AI 컴퍼니로의 전환을 가속화함에 따라 전력 소비가 높은 GPU 서버 도입이 증가하고 있는 상황 속에서 이번 액침 냉각 도입을 통해 상당한 수준의 에너지 비용 절감이 기대되며, 향후 해당 기술 보급 확산을 통해 탄소중립 목표 달성에도 이바지하겠다”고 밝혔다.



오수연 기자 syoh@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.