Intel 推出第四代 Xeon 可擴展處理器:最多 60 核,可支持 8 路平台
Intel 推出了代號為 Sapphire Rapids 第四代 Xeon 可擴展處理器,以及代號為 Sapphire Rapids HBM 的 Xeon Max 系列,和代號為 Ponte Vecchio 的數據中心 GPU Max 系列,這是用於高性能計算、人工智慧、雲端計算、網絡等領域的產品,為客戶帶來高效和安全的計算能力,並且還有各種新功能。
Sapphire Rapids 第四代 Xeon 可擴展處理器最多擁有 60 個核心,比第三代 Ice Lake Xeon 處理器提升了 50%,計算能力則提高了 53%,它由四個集群組成,使用了 EMIB 技術進行連接然後封裝在一起,最高 TDP 為 350W,採用了 Intel 7 製程。支持 PCI-E 5.0、CXL 1.1(Compute Express Link)和八通道 DDR5 記憶體,同時會延續 Intel 的內置 AI 加速策略,支持 Intel 高級矩陣擴展(AMX)。Intel 聲稱在某些工作負載中,每瓦性能比上一代型號平均提高了 2.9倍,人工智慧推理和訓練提高了 10 倍,數據分析工作負載提高了 3 倍。
第四代 Xeon 可擴展處理器一共有 52 個型號,其中 9400 系列歸屬於 Max 系列,而 8000 系列則屬於 Platinum 系列,6000 與 5000 系列則屬於 Gold 系列,4000 系列屬於 SiLver 系列,3000 系列屬於 Bronze 系列,通用型號是面向雙路平台的,還區分為「性能」與「主流」兩個分類,此外還有液冷、單插槽、網路、雲端、HPC 以及儲存 / HCI 系統的專屬型號,每個型號的可擴展型都不一樣,具體請看上表。
而之前 Max 處理器則是帶 HBM 記憶體的型號,每顆 Xeon Max 包含了 64GB 的 HBM2e 記憶體,有 32 到 56 核的型號,HBM 記憶體有助於處理對內核數量不那麼敏感的記憶體受限工作負載,因此 Max 型號的記憶體數比標準型少,目標工作負載包括計算流體動力學、氣候和天氣預報、AI 訓練和推理、大數據分析、記憶體數據庫和儲存應用,與競爭對手的產品相比,在實際 HPC 工作負載中,Xeon Max 的性能會高出 4.8 倍。
在 Sapphire Rapids 上有四種類型的加速器,DSA 數據流加速器可以減輕 CPU 的數據複製和數據轉換操作的負擔並優化數據移動效率,DLB 動態負載均衡器可以在多個 CPU 核心 / 執行緒上高效地分配網路處理,並根據系統負載的變化而動態地在多個 CPU 核心上分配網絡數據以進行處理。IAA 記憶體分析加速器,可幫助更快速地運行數據庫和分析工作負載並提升能效。對於記憶體數據庫和大數據分析工作負載,該內置加速器可在提高查詢吞吐量的同時減少記憶體佔用。QAT 數據保護與壓縮加速技術,這功能曾經整合在晶片組上,可以增強加密和壓縮、解壓縮性能,現在被整合到 CPU 裡面。
和以前一樣,第四代 Xeon 可擴展處理器支持單、雙、四和八路系統,這與 AMD 的 EPYC 僅支持雙路平台有很大不同,單論 CPU 數量的話 AMD 單顆處理器確實更多,但 Xeon 的單個平台的總核心數量則更佔優勢,但 PCIe 數量的話還是 AMD 平台佔優,EPYC Genoa 可提供 128 條 PCIe 5.0 通道,而 Sapphire Rapids 最多是 80 條。
與以往一樣,第四代 Xeon 可擴展處理器也分 XCC 和 MCC 兩種晶片,其中 XCC 是由四個小晶片採用 EMIB 封裝組成的,最多 60 核,TDP 從 225W 到 350W,最多擁有 QAT、DLB、IAA、DSA 加速器各 4 個,最大可支持 8 路平台。而 MCC 則是單個大晶片,最多 32 核,TDP 從 125W 到 350W,最多擁有兩個 QAT 和 DLB,而 DSA 和 IAA 只有一個。
第四代 Xeon 可擴展處理器採用 LGA 4677 腳位,對應的是 C740 晶片組,支援 8 通道的 DDR5-4800 記憶體,可提供 80 條 PCIe 5.0 通道以及最多支援 4 個 CXL 1.1 Type 1 和 Type 2 設備。
Xeon GPU Max 系列採用了 Xe-HPC 架構的計算晶片,是唯一具有原生光線追踪加速功能的 HPC / AI GPU,旨在加速科學可視化,是針對要求最苛刻的計算工作負載的新基礎架構。其擁有 64MB 的 L1 快取和 408MB 的 L2 快取(業界最高),提高了可吞吐量和性能。
Xeon GPU Max 系列提供了多種外形尺寸,以滿足不同客戶的需求,分別有:
- Max 1100 – 雙槽 PCIe 外形,56 個 Xe 核心和 48GB 的 HBM2e vRAM,可通過 Intel Xe Link 橋接器實現多卡連接,TDP 為 300W
- Max 1350 – OAM 模組,112 個 Xe 核心和 96GB 的 HBM2e vRAM,TDP 為 450W
- Max 1550 – Intel 性能最高的 OAM 模組,128 個 Xe 核心和 128GB 的 HBM2e vRAM,TDP 為 600W
除了 PCIe 單卡和 OAM 模組以外,Intel 還提供了 x4 GPU OAM 載板和 Intel 數據中心 GPU Max 系列子系統,以實現子系統內的高性能多 GPU 通訊。
歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Google News 可以隨時 follow!