주요 내용:
- 엔비디아의 루빈 플랫폼은 45°C 냉각수를 사용하는 최초의 100% 액체 냉각 AI 시스템
- 폐쇄 루프 설계로 물 소비량을 거의 제로로 줄이고 PUE를 1.15로 낮춤
- 50메가와트 규모 시설, 연간 냉각 비용 400만 달러 이상 절감 가능
주요 내용:

엔비디아의 루빈 아키텍처는 업계 최초로 100% 액체 냉각된 AI 플랫폼으로, 45°C 냉각수를 사용해 팬을 없애고 데이터센터 물 소비량을 최대 100%까지 줄인다.
엔비디아의 루빈 세대는 온수 욕조보다 뜨거운 45°C의 냉각수를 밀폐형 팬리스 설계에서 순환시켜 데이터센터 냉각 용수 소비를 거의 제로 수준으로 낮췄다. 이는 냉각이 전체 전력 사용량의 최대 40%를 차지하는 업계에서 중요한 이정표다.
"드라이 쿨러 기반 설계로 증발식 수냉각이 없는 폐쇄 루프 시스템입니다. 일부 기후에서는 연중 약 1% 정도만 칠러가 필요할 수 있습니다"라고 알리 헤이다리 엔비디아 데이터센터 냉각 담당 디렉터는 말했다.
이 시스템은 모든 프로세서, 네트워킹 칩 및 전원 구성품에 직접 장착된 콜드 플레이트를 통해 75% 물과 25% 프로필렌 글리콜 혼합액을 순환시킨다. 이전 세대의 하이브리드 공기-액체 방식을 완전히 대체한 것이다. 냉각수는 45°C로 랙에 유입된 후 칩 표면에서 열을 흡수하며 약 55°C로 배출된다. 엔비디아에 따르면 이 기술을 도입한 50메가와트 규모의 하이퍼스케일 시설은 냉각 관련 에너지 및 물 비용에서 연간 400만 달러 이상을 절감할 수 있으며, PUE를 1.35에서 1.15로 낮춘다.
72개의 GPU와 36개의 CPU를 통합하고 캐비닛당 100kW를 초과하는 전력 밀도를 자랑하는 루빈 NVL72 랙은 개당 최대 880만 달러에 가격이 책정됐다. 엔비디아 주식은 6월 19일 210.69달러에 거래되며 시가총액 5조 1400억 달러를 기록했다. 이번 냉각 혁신은 AI 인프라 확장의 핵심 병목 현상을 제거함으로써, 하이퍼스케일러들이 데이터센터 전력의 모든 와트를 면밀히 분석하는 시점에 AMD 및 맞춤형 ASIC 경쟁사에 맞선 엔비디아의 경쟁력을 강화한다.
45°C 냉각수가 데이터센터의 물리학을 바꾸는 방법
전통적인 데이터센터는 냉난방 통로를 통해 냉각 공기를 밀어내기 위해 에너지 집약적인 칠러와 팬에 의존하며, 냉각 팬은 85데시벨 이상의 소음을 발생시킨다. 엔비디아의 접근 방식은 이러한 모델을 완전히 뒤집는다. 액체 냉각 콜드 플레이트를 통해 칩에서 직접 열을 포착함으로써, 시스템은 연중 대부분 기계식 냉각 없이 옥외 드라이 쿨러(본질적으로 대형 라디에이터 코일)를 통해 열을 방출할 수 있다.
지리적 조건이 중요한 변수다. 기후가 서늘한 지역의 시설은 칠러 없이 완전히 운영될 수 있는 반면, 피닉스 같은 지역은 무더운 여름철 최고조에 소량의 칠러 가동이 필요할 수 있다. 더운 지역에서도 45°C 냉각수로의 전환은 운영자를 칠러가 없는 이상적인 상태에 더 가깝게 만들어 주며, 칠러는 연간 며칠만 가동될 가능성이 높다.
루빈 플랫폼은 콜드 플레이트에 마이크로채널 기술도 도입했다. 유로 채널은 정밀 밀링, 스키빙, 레이저 가공, 에칭 또는 3D 프린팅과 같은 기술을 사용해 미크론 수준의 정밀도로 가공된다. 후위안증권의 애널리스트 리저에 따르면 구리는 알루미늄보다 우수한 열전도율 덕분에 이러한 마이크로채널 콜드 플레이트의 선호 기반 소재다.
공급망 및 경쟁 구도에 미치는 영향
100% 액체 냉각으로의 전환은 데이터센터 공급망 전반에 걸쳐 파급 효과를 창출한다. 슈나이더 일렉트릭의 첨단 냉각 사업부인 모티베어(Motivair)는 거의 10년 동안 엔비디아의 제품 로드맵과 협력해 왔으며, 신뢰성을 높이고 누출 위험을 최소화하기 위해 고임피던스 냉각수 제제를 개발했다. "칩당 와트가 특정 수준을 넘어서자 액체 냉각은 선택이 아닌 필수가 되었습니다"라고 리처드 휘트모어 모티베어 사장 겸 CEO는 말했다.
AI 인프라를 구축 중인 클라우드 제공업체에게 운영 비용 절감은 실질적이다. 기존 냉각탑 시스템을 사용하는 시설은 메가와트당 연간 약 260만 갤런의 물을 소비한다. 엔비디아의 폐쇄 루프 설계는 이 소비량의 거의 대부분을 없앤다. AI 팩토리의 잔여 열을 인근 상업용 또는 주거용 건물 난방에 재활용하는 폐열 회수 가능성은 또 다른 가치를 더한다.
블랙웰의 후속 모델인 엔비디아의 루빈 아키텍처는 차세대 하이퍼스케일 AI 배포를 지원할 예정이다. 단일 캐비닛 전력이 200kW를 초과함에 따라 이러한 밀도에서는 공기 냉각이 더 이상 viable한 선택지가 아니다. AMD와 증가하는 맞춤형 ASIC 설계 업체들을 포함한 경쟁사들은 AI 하드웨어 시장에서 경쟁력을 유지하기 위해 엔비디아의 열 엔지니어링에 필적하는 기술력을 갖춰야 할 것이다.
엔비디아 주식은 선행 주당순이익의 약 35배에 거래되고 있다. 냉각 효율성 개선이 설치 기반 전반에 광범위하게 채택될 경우, 하이퍼스케일러의 총소유비용(TCO)을 연간 수억 달러 절감할 수 있으며, 이는 루빈 랙의 프리미엄 가격을 정당화하고 AI 인프라에서 엔비디아의 지배적 위치를 강화하는 요인이 될 수 있다.
본 기사는 정보 제공 목적으로만 작성되었으며 투자 조언을 구성하지 않습니다.