Intel 反擊 AMD!稱第 5 代 Xeon 在適當最佳化下比 AMD EPYC Turin 更快
Intel 質疑 AMD 資料中心 AI 性能宣稱,強調適當最佳化的重要性
Intel 針對 AMD 第 5 代 EPYC Turin 處理器在資料中心 AI 性能的宣稱做出回應,表示在適當最佳化下,第 5 代 Xeon AI 的性能更快。
在 Computex 2024 上,AMD 正式發表其使用最新 Zen 5 核心架構的第 5 代 EPYC CPU 家族,代號為 Turin。該公司針對 Intel 第 5 代 Xeon 家族(代號 Emerald Rapids)發布一些數據,特別是在 AI 吞吐量工作負載方面,但 Intel 現在澄清,這些基準測試是在沒有對 Xeon 家族進行適當最佳化情況下進行的,而在實施這些最佳化後,即便是第 5 代 Xeon 也應該能夠 AI 性能方面輕鬆超過第 5 代 EPYC Turin。
Intel 質疑 AMD Llama2-7B Chatbot 基準測試
Intel 特別強調 AMD 使用的 Llama2-7B Chatbot 基準測試,該測試基於 INT4 推理吞吐量,並在 50ms 延遲下進行。AMD 表示,其第 5 代 EPYC CPU 在 2S(雙插槽)配置下,每個 CPU 具有 128 個核心,可提供高達每秒 671 token 的性能,而 Intel 第 5 代 Xeon Platinum 8592+ 晶片在相同的雙插槽配置下,每個 CPU 具有 64 個核心,僅提供每秒 125 tokens 的輸出,這對 AMD EPYC Turin CPU 來說是 5.4 倍的性能差距。
Intel 表示,這些基準測試是在沒有為第 5 代 Xeon 系列使用正確軟體套件情況下進行的,而 AMD 在其註釋中沒有提供任何有關 Intel 配置的詳細資訊。
Intel 最佳化後軟體基準測試結果大不相同
Intel 已在相同的 AI 工作負載中進行性能基準測試,結果看來截然不同。
使用 Intel Extension for PyTorch(P99 延遲),第 5 代 Emerald Rapids Xeon CPU 每秒 686 Token 的輸出超過 AMD 第 5 代 EPYC Zen 5 CPU 的性能。這不僅要歸功於 Intel 對 Llama2 的軟體最佳化,也要歸功於第 5 代 Emerald Rapids 家族中增加的 AI 硬體加速器,提供性能提升。
Intel 並未就此止步,該公司還表示,在其他兩個工作負載(翻譯和摘要)中,與 AMD 在 Computex 2024 展示中使用的結果相比,該公司看到 1.2 倍至 2.3 倍的性能提升。
此外,更關鍵的是,這些基準測試在很大程度上取決於記憶體,而下一代 EPYC Turin 家族將採用 12 通道 DDR5 介面。雖然 Intel 當前一代的 Xeon Emerald Rapids 系列 CPU 最多支援 8 個 DDR5 記憶體通道,但下一代 Granite Rapids 系列 Xeon 6700P / 6900P CPU 不僅將搭載相同的「最多」12 通道記憶體介面,還將具有相同的 128 個 P 核心,而 Xeon 6900E 家族則最多可搭載 288 個 E 核心,預計於 2025 年初推出。Granite Rapids Xeon 6700P CPU 則將於 2024 年第三季推出,最多可搭載 86 個 P 核心。
AI 領域激烈競爭促使各廠商重視性能宣稱
看來目前所有參與 AI 業務的主要公司都非常重視自己的性能宣稱,也非常關注其他公司展示的內容。幾個月前,當 AMD 宣布其 MI300X 數據與 Hopper 陣容相比時,NVIDIA 和 AMD 就展開了類似的較量,從那時起便你來我往。
同樣地,在 AI PC 領域,AMD、Intel、高通和 NVIDIA 等公司也在展開激烈角力,AI TOPs 成為熱門話題。隨著各科技領域對 AI 需求的不斷增長,所有科技公司也都在努力吸引更多客戶使用他們的產品,以滿足日益增長的強大硬體需求,這樣的競爭還會持續下去。
歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Google News 可以隨時 follow!