2024-12-24

Supermicro 採用 NVIDIA GB200 NVL72 和 NVIDIA HGX B200 系統支援的液體冷卻超級叢集,為 AI 資料中心提供全新的節能超級規模運算模式

Supermicro 採用 NVIDIA GB200 NVL72 和 NVIDIA HGX B200 系統支援的液體冷卻超級叢集,為 AI 資料中心提供全新的節能超級規模運算模式

Supermicro 點對點液冷式解決方案與 NVIDIA Blackwell 平台,共同推進業界轉型為永續 AI 資料中心

加利福尼亞州聖何塞2024年10月17日 /美通社/ — Supermicro, Inc.(納斯達克:SMCI)是人工智能 (AI)、雲端、儲存和 5G/Edge 的全面 IT 解決方案供應商,透過 NVIDIA Blackwell 平台加速業界轉型到液體冷卻資料中心,為新人工智能 (AI) 基礎架構的能源需求,提供全新的能源效益模式。Supermicro 領先業界的端對端液體冷卻解決方案採用 NVIDIA GB200 NVL72 平台提供支援,可在同一機架中進行大規模運算,並已開始向特定客戶提供樣品,以便在第四季末進行全面生產。此外,最近發表的 Supermicro X14 和 H14 4U 液冷系統以及 10U 風冷系統,均可搭配 NVIDIA HGX B200 8-GPU 系統進行生產。

Nvidia Blackwell 人工智能點對點解決方案

Supermicro 主席暨行政總裁 Charles Liang 表示:「我們正在推動永續 AI 運算的未來,我們的液冷式 AI 解決方案正被世界一些最具野心的 AI 基礎設施項目採用,自 2024 年 6 月起出貨的液冷機架超過 2000 部。「Supermicro 採用 NVIDIA Blackwell 平台的點對點液體冷卻解決方案,能夠釋放下一代 GPU 的計算能力、成本效益和能源效率,例如 NVIDIA GB200 NVL72 的一部分,這是一部在同一機架中有著多個計算節點的超級電腦。Supermicro 在部署液體冷卻 AI 基礎架構方面擁有豐富的經驗,加上全面的現場服務、管理軟件和全球製造能力,為客戶提供獨特優勢,以最強大且永續的 AI 解決方案改造資料中心。」

https://www.supermicro.com/en/solutions/ai-supercluster

Supermicro 適用於 NVIDIA GB200 NVL72 平台系統的液冷式 SuperClusters,配備全新先進的機架內 (In-rack) 或排內 (In-row) 冷卻劑分配器 (CDU),以及專為 1U 外型尺寸的計算盤所設計的定制冷板,可容納兩塊 NVIDIA GB200 Grace Blackwell 超級晶片。Supermicro 的 NVIDIA GB200 NVL72 可透過 Supermicro 的點對點液冷解決方案,在同一機架內展現超級 AI 運算能力。此機架解決方案將 72 塊 NVIDIA Blackwell GPU 和 32 塊 NVIDIA Grace CPU 組合,透過 NVIDIA 第五代 NVLink 網路進行互聯。NVIDIA NVLink Switch 系統能以極低的時延 (Low Latency),提供每秒 130 TB (TB/s) 的 GPU 通訊總量,提升 AI 與高效能運算 (HPC) 工作負載的效能。此外,Supermicro 也支援最近發表的 NVIDIA GB200 NVL2 平台,此 2U 氣冷式系統內置緊密耦合的兩塊 NVIDIA Blackwell GPU 與兩塊 NVIDIA Grace CPU,適合輕鬆部署各種工作負載,例如大型 LLM 推理、檢索增強生成 (RAG)、數據處理與 HPC 應用。

Supermicro 領先的 4U 液冷系統與全新的 10U 氣冷系統,現已支援 NVIDIA HGX B200 8-GPU 系統,隨時可以投入生產。新研發的冷板與 250kW 容量的機架內冷卻液分配裝置,可盡情發揮 8-GPU 系統的效能與效率,在同一 48U 機架上提供 64x 1000W NVIDIA Blackwell GPU 與 16x 500W CPU。同一機架上最多可安裝 4 個全新的 10U 氣冷式系統,彼此完全整合,密度與前一代相同,同時提供高達 15 倍的推論和 3 倍的訓練效能。

SuperCloud Composer 軟件是 Supermicro 的綜合資料中心管理平台,提供強大的工具來監控液冷系統和機架、冷卻液分配單元和冷卻塔的重要資訊,包括壓力、濕度、泵和閥門條件等。SuperCloud Composer 的液體冷卻諮詢模組 (LCCM) 可降低營運成本,有助液冷數據中心保持完整性。

Supermicro 為數百萬億參數的 AI 模型擴充基礎架構,在採用 InfiniBand 和乙太網路的網路創新技術方面都走在最前線,包括 NVIDIA BlueField®-3 SuperNIC 和 400Gb/s 的 NVIDIA ConnectX®-7、NVIDIA ConnectX®-8、Spectrum™-4 和 NVIDIA Quantum-3,為 NVIDIA Blackwell 平台實現 800Gb/s 網路。NVIDIA Spectrum-X™ Ethernet 配置 Supermicro 的 4U 液冷和 8U 氣冷 NVIDIA HGX H100 和 H200 系統叢集,為現時為止最大型的 AI 部署提供動力。 

從概念證明 (PoC) 到全面部署,Supermicro 是一站式服務,提供所有必要的技術支援、液體冷卻、網絡解決方案和現場安裝服務。Supermicro 提供全面的內部設計液體冷卻生態系統,包括針對各種 GPU、CPU 和記憶體模組最佳化的定制冷卻板,以及多種 CDU 外型尺寸和容量、歧管、軟管、連接器、冷卻塔,以及監控與管理軟件。此點對點解決方案可無縫整合至機架式配置,大幅提升系統效率、減少熱節流現象 (Thermal Throttling),同時降低營運數據中心的整體擁有成本 (Total Cost of Ownership, TCO) 和對環境的影響。

Supermicro 參加 2024 OCP Global Summit

  • 全新 X14 4U 液冷系統配置 NVIDIA HGX B200 8-GPU 系統
  • Supermicro 的 SuperCluster NVIDIA GB200 NVL72 Platform 4
  • H13 4U 液冷系統配置 NVIDIA HGX H200 8-GPU 系統
  • X14 JBOF 系統
  • X14 1U CloudDC 配以 OCP DC-MHS 設計

在 2024 年 10 月 15 日至 17 日,請親臨加利福尼亞州聖何塞的 OCP Global Summit 的 21 號展位,以了解更多資訊。

Super Micro Computer, Inc. 簡介

Supermicro(納斯達克股票代碼:SMCI))是應用優化整體 IT 解決方案的全球領軍企業。Supermicro 在加州聖荷西創立和營運,致力為企業、雲端、AI 和 5G 電信/邊緣 IT 基礎設施,提供市場創新。我們是全方位的 IT 解決方案製造商,提供伺服器、人工智能、儲存、物聯網、交換器系統、軟件和支援服務。Supermicro 的主機板、電源和機箱設計專業知識,進一步支援開發和生產,並為全球客戶實現從雲端到邊緣的新一代創新。我們的產品均在公司內部(包括美國、亞洲和荷蘭)完成設計和製造,透過全球營運壯大規模和加強效益,從而優化整體擁有成本 (TCO),並透過綠色運算減少對環境的影響。獲獎無數的 Server Building Block Solutions® 透過我們靈活可重用的構建模組,為客戶提供各適其適的系統產品系列,用於優化其確切的工作負載和應用程式。這些構建模組支援全系列外形規格、處理器、記憶體、GPU、儲存、網絡、電源和冷卻解決方案(空調、自然空氣冷卻或液體冷卻)。

Supermicro、Server Building Block Solutions 和 We Keep IT Green 是 Super Micro Computer, Inc. 的商標和/或註冊商標。

所有其他品牌、名稱和商標均為其各自所有者的財產。