Kiến trúc Rubin của NVIDIA là nền tảng AI đầu tiên trong ngành sử dụng 100% tản nhiệt lỏng, vận hành với chất làm mát 45°C để loại bỏ quạt và giảm tới 100% lượng nước tiêu thụ tại trung tâm dữ liệu.
Thế hệ Rubin của NVIDIA sử dụng chất làm mát nóng tới 45°C — ấm hơn cả bồn tắm nước nóng — trong một thiết kế kín, không quạt, cắt giảm lượng nước làm mát tại trung tâm dữ liệu xuống gần bằng 0, một cột mốc quan trọng trong một ngành mà chi phí làm mát chiếm tới 40% điện năng tiêu thụ.
"Với các thiết kế dựa trên bộ tản nhiệt khô, đó là một hệ thống vòng kín không sử dụng nước làm mát bay hơi — ngoại trừ khoảng 1% thời gian trong năm khi chúng tôi có thể cần máy làm lạnh ở một số vùng khí hậu," Ali Heydari, Giám đốc bộ phận làm mát trung tâm dữ liệu của NVIDIA, cho biết.
Hệ thống lưu thông hỗn hợp 75% nước và 25% propylene glycol qua các tấm làm mát gắn trực tiếp trên mọi bộ vi xử lý, chip mạng và linh kiện nguồn — loại bỏ hoàn toàn phương pháp kết hợp không khí-chất lỏng của các thế hệ trước. Chất làm mát đi vào tủ rack ở 45°C và thoát ra ở khoảng 55°C sau khi hấp thụ nhiệt trên bề mặt chip. Một cơ sở dữ liệu siêu quy mô công suất 50 megawatt áp dụng công nghệ này có thể tiết kiệm hơn 4 triệu USD mỗi năm từ chi phí năng lượng và nước liên quan đến làm mát, theo NVIDIA, đồng thời giảm PUE từ 1,35 xuống 1,15.
Các tủ rack Rubin NVL72, tích hợp 72 GPU và 36 CPU với mật độ năng lượng vượt quá 100 kW mỗi tủ, có giá lên tới 8,8 triệu USD mỗi tủ. Cổ phiếu NVIDIA giao dịch ở mức 210,69 USD vào ngày 19 tháng 6, đưa vốn hóa thị trường của công ty lên 5,14 nghìn tỷ USD. Cải tiến làm mát này loại bỏ một nút thắt quan trọng trong việc mở rộng quy mô hạ tầng AI, củng cố vị thế cạnh tranh của NVIDIA trước AMD và các đối thủ ASIC tùy chỉnh tại thời điểm các nhà vận hành siêu quy mô đang soi xét từng watt điện năng tiêu thụ của trung tâm dữ liệu.
Chất làm mát 45°C Thay đổi Vật lý của Trung tâm Dữ liệu như thế nào
Các trung tâm dữ liệu truyền thống phụ thuộc vào máy làm lạnh và quạt tiêu tốn nhiều năng lượng để đẩy không khí làm mát qua các lối đi nóng và lạnh, với quạt làm mát tạo ra độ ồn ở mức hoặc trên 85 decibel. Cách tiếp cận của NVIDIA đảo ngược mô hình đó: bằng cách thu nhiệt trực tiếp tại chip thông qua các tấm làm mát bằng chất lỏng, hệ thống có thể thải nhiệt qua các bộ tản nhiệt khô ngoài trời — về cơ bản là các cuộn tản nhiệt lớn — mà không cần làm lạnh cơ học trong phần lớn thời gian trong năm.
Yếu tố địa lý đóng vai trò quan trọng. Các cơ sở dữ liệu ở vùng khí hậu mát hơn có thể vận hành hoàn toàn không cần máy làm lạnh, trong khi các địa điểm như Phoenix có thể cần kích hoạt máy làm lạnh tối thiểu trong những ngày hè cao điểm. Ngay cả ở các khu vực ấm hơn, việc chuyển sang chất làm mát 45°C đưa các nhà vận hành đến gần hơn với lý tưởng không cần máy làm lạnh, với máy làm lạnh có thể chỉ chạy vài ngày mỗi năm.
Nền tảng Rubin cũng giới thiệu công nghệ vi kênh trong các tấm làm mát, với các kênh dẫn lưu chất được gia công với độ chính xác ở cấp độ micron bằng các kỹ thuật như phay chính xác, cắt gọt, xử lý laser, khắc axit hoặc in 3D. Đồng là vật liệu nền ưa thích cho các tấm làm mát vi kênh này nhờ độ dẫn nhiệt vượt trội so với nhôm, theo nhà phân tích Li Ze của Huayuan Securities.
Tác động đến Chuỗi Cung ứng và Cạnh tranh
Sự chuyển đổi sang làm mát bằng chất lỏng 100% tạo ra những tác động dây chuyền khắp chuỗi cung ứng trung tâm dữ liệu. Motivair, bộ phận làm mát tiên tiến của Schneider Electric, đã hợp tác với lộ trình sản phẩm của NVIDIA trong gần một thập kỷ, phát triển các công thức chất làm mát có trở kháng cao để tăng cường độ tin cậy và giảm thiểu rủi ro rò rỉ. "Một khi số watt trên mỗi chip vượt qua một ngưỡng nhất định, làm mát bằng chất lỏng trở thành bắt buộc," Chủ tịch kiêm CEO của Motivair, Richard Whitmore, cho biết.
Đối với các nhà cung cấp dịch vụ đám mây đang xây dựng hạ tầng AI, khoản tiết kiệm vận hành là rất đáng kể. Một cơ sở dữ liệu sử dụng hệ thống tháp giải nhiệt thông thường tiêu thụ khoảng 2,6 triệu gallon nước mỗi megawatt mỗi năm. Thiết kế vòng kín của NVIDIA loại bỏ gần như toàn bộ lượng tiêu thụ đó. Tiềm năng thu hồi nhiệt thải — tái sử dụng nhiệt dư từ các nhà máy AI để sưởi ấm các tòa nhà thương mại hoặc dân cư lân cận — bổ sung thêm một lớp giá trị khác.
Kiến trúc Rubin của NVIDIA, sản phẩm kế nhiệm của Blackwell, dự kiến sẽ cung cấp năng lượng cho làn sóng triển khai AI siêu quy mô tiếp theo. Với công suất mỗi tủ rack vượt quá 200 kW, làm mát bằng không khí không còn khả thi đối với các mật độ này. Các đối thủ cạnh tranh bao gồm AMD và đội ngũ các nhà thiết kế ASIC tùy chỉnh đang phát triển sẽ cần phải sánh ngang với kỹ thuật nhiệt của NVIDIA để duy trì khả năng cạnh tranh trên thị trường phần cứng AI.
Cổ phiếu NVIDIA giao dịch ở mức khoảng 35 lần thu nhập dự phóng. Lợi ích từ hiệu suất làm mát, nếu được áp dụng rộng rãi trên toàn bộ cơ sở lắp đặt, có thể giảm tổng chi phí sở hữu cho các nhà vận hành siêu quy mô hàng trăm triệu USD mỗi năm — một yếu tố có thể biện minh cho mức giá cao của các tủ rack Rubin và củng cố vị thế thống trị của NVIDIA trong hạ tầng AI.
Bài viết này chỉ mang tính chất tham khảo và không cấu thành lời khuyên đầu tư.