IBM 推出全新Telum處理器,依託新一代 IBM Z 大型主機加速 AI 應用
新聞要點:
- 新一代IBM Telum II 處理器和 IBM Spyre 加速器可釋放更多企業級 AI 能力,包括大語言模型和生成式 AI
- 先進的 IO 技術實現並簡化可擴展的 IO 子系統,進一步降低能耗和數據中心佔地面積
香港2024年9月2日 /美通社/ — 近日,IBM(紐約證券交易所:IBM)在 Hot Chips 2024大會上公佈了即將推出的 IBM Telum® II 處理器和 IBM Spyre™ 加速器的架構細節。這些新技術旨在大幅擴展下一代 IBM Z 大型主機系統的處理能力,通過新的 AI 集成方法,加速企業對傳統 AI 模型和大語言 AI 模型的協同使用。
隨著基於大語言模型的 AI 項目從概念驗證階段進入生產階段,企業對高能效、高安全性和高度可擴展解決方案的需求日益迫切。摩根士丹利最近發佈的一份研究報告預測,在未來幾年,生成式 AI 的電力需求將以每年 75% 的速度激增,其 2026 年的能耗或將與西班牙 2022 年的全年能耗相當。許多 IBM 客戶表示,支持適當規模的基礎模型和針對 AI 工作負載的混合架構越來越重要。
此次IBM發佈的主要創新技術包括:
- IBM Telum II 處理器:這一全新芯片將搭載於下一代 IBM Z 系列主機,與第一代 Telum 芯片相比,其頻率和內存容量均有提升,高速緩存提升40%;集成 AI 加速器內核和數據處理單元 (DPU) 的性能也得到改善。IBM Telum II處理器將支持大語言模型驅動的企業計算解決方案,滿足金融等行業的複雜交易需求。
- IO 加速單元:Telum II 處理器芯片上的全新數據處理單元 (DPU) 旨在加速大型主機上用於聯網和數據存儲的複雜 IO 協議,可簡化系統操作,提高關鍵組件性能。
- IBM Spyre加速器:可提供額外的AI計算能力,與 Telum II 處理器相得益彰。Telum II 和 Spyre 芯片共同構成了一個可擴展的架構,可支持AI集成建模方法,即將多個機器學習或深度學習的AI模型與基於編碼器的大語言模型相結合。通過利用每個模型架構的優勢,AI集成的方法可以生成比單個模型更準確、更穩健的結果。Spyre 加速器芯片在 Hot Chips 2024 大會期間進行了預覽,並將作為Telum II 處理器的附加選件提供。每個加速器芯片均與IBM 研究院合作開發,通過一個 75 瓦 PCIe 適配器連接。與其他 PCIe 卡一樣,Spyre 加速器可根據客戶需求進行擴展。
IBM主機和 LinuxONE 產品管理副總裁 Tina Tarquinio 表示:「得益於IBM強大的多代並行的開發路線圖,我們得以在保持技術領先的同時,滿足企業不斷升級的 AI 需求。Telum II 處理器和 Spyre 加速器旨在提供安全、節能、高性能的企業計算解決方案。這些多年研發的創新成果將被引入下一代 IBM Z 平台,幫助客戶大規模利用大語言模型和生成式 AI技術。」
Telum II 處理器和 IBM Spyre 加速器將由 IBM 的長期合作夥伴三星晶圓代工(Samsung Foundry)生產,採用其高性能、高能效的 5 納米工藝節點。二者將共同支持企業的先進AI 用例,釋放業務價值,從而創造新的競爭優勢。利用AI集成的方法,客戶可以更快、更準確地獲得預測結果。適用的生成式 AI用例包括:
- 保險理賠欺詐檢測:通過AI集成方法將大語言模型與傳統神經網絡相結合,以提高性能和準確性,增強對保險理賠欺詐的檢測。
- 反洗錢高級監測:對可疑金融活動進行高級檢測,支持遵守監管要求並降低金融犯罪風險。
- AI 助理:加速應用生命週期、知識和專業技能的傳授、代碼解釋和轉換等。
規格和性能指標:
- Telum II 處理器:配備八個運行頻率達 5.5GHz的高性能內核,每個內核配備 36MB二級高速緩存,片上高速緩存容量增加 40%(總容量達 360MB)。每個處理器抽屜的虛擬 L4 高速緩存為 2.88GB,相比上一代增加 40%。集成的 AI 加速器可實現低延遲、高吞吐量的交易中 AI 推理,例如增強金融交易期間的欺詐檢測,並且每塊芯片的計算能力是上一代的四倍。
Telum II 芯片中集成了最新的 IO 加速單元 DPU。在設計上,其IO 密度提高 50%,可大幅提高數據處理能力,進一步提高 IBM Z 的整體效率和可擴展性,使其成為處理大規模AI工作負載和數據密集型應用的不二之選。
- Spyre 加速器:這是一款專為複雜 AI 模型和生成式 AI 用例提供可擴展功能的企業級加速器。它有高達 1TB 的內存,可在普通 IO 抽屜的八塊卡上串聯工作,以支持大型主機的整體 AI 工作負載,同時每塊卡的功耗不超過 75W。每塊芯片由 32 個計算內核組成,支持 int4、int8、fp8 和 fp16 數據類型,適用於低延遲和高吞吐量的 AI 應用。
產品時間表
作為 IBM 下一代 IBM Z 和 IBM LinuxONE 平台的中央處理器,Telum II 處理器預計在 2025 年向 IBM Z 和 LinuxONE 客戶提供。IBM Spyre 加速器仍在技術預覽階段,預計也將於 2025 年推出。
關於 IBM 未來方向和意向的聲明可能會隨時更改或撤銷,恕不另行通知。
訪問下方鏈接瞭解更多:
- Telum II:https://www.ibm.com/blog/announcement/telum-ii
- IBM Spyre:https://research.ibm.com/blog/spyre-for-z
- IO 加速器:https://community.ibm.com/community/user/ibmz-and-linuxone/blogs/michael-becht/2024/08/23/io-accelerator?communityKey=e7b7d299-8509-4572-8cf1-c1112684644f
關於 IBM
IBM 是全球領先的混合雲與人工智能、以及企業服務提供商,為全球175個國家和地區的客戶服務,幫助企業把握其數據洞察、簡化業務流程、降本增效,獲得行業競爭優勢。 IBM 混合雲平台和紅帽OpenShift 為全球超過4,000家政府和企業機構的關鍵性基礎設施提供有力支撐,例如來自金融服務、電訊和醫療健康等行業的客戶,幫助他們快速、高效、安全地實現數碼轉型。 IBM 在人工智能、量子運算、特定行業的雲解決方案以及企業服務等方面的突破性創新,使其可以為客戶提供開放和靈活的選擇。 IBM 對信任、透明、責任、包容和服務的歷久彌新的承諾,是我們業務發展的基石。查詢更多資料,請瀏覽:www.ibm.com/
關於 IBM 香港,請登入Facebook 頁面 www.facebook.com/IBMHongKong
傳媒查詢:郭韜 [email protected]