TechSpace 鐵客空間

每日科技新聞新知、硬體開箱評測、賣場優惠!

Intel Arc Pro B70 四卡 Battlematrix 實測:AI 推論吃電 720W,CP 值仍輾壓 NVIDIA?

外媒實測 Intel Arc Pro B70 四卡 Battlematrix 配置,在 AI 推論工作負載下總功耗高達 720.6W,雖然數字看起來驚人,但仍低於官方 TDP 理論上限。搭配 128GB VRAM、能跑動 120B 參數大模型,加上每張不到一千美元的定價,Arc Pro B70 究竟能不能成為本地 AI 推論的高 CP 值新選擇?
intel arc pro b70 quad gpu setup needs up to 720w

四張 Arc Pro B70 齊上陣,720W 功耗嚇人但 CP 值依舊亮眼

Intel 的 Arc Pro B70 顯示卡近期在工作站 AI 推論市場掀起不小的話題,而這股討論的火花,來自德國科技媒體 Hardwareluxx 發布的一篇深度評測,其內容不僅是目前市場上少見針對 Battlematrix 四卡配置的完整實測報告,更揭露這套方案在 AI 推論工作負載下的真實功耗數據,讓外界終於對這款顯示卡的實力有更具體的認識。

值得一提的是,Intel 在 Arc Pro B70 的媒體曝光策略上顯得相當低調保守,僅有極少數媒體獲得完整的四卡測試機會,這也讓這份評測的參考價值格外珍貴。

Hardwareluxx 的測試環境採用一台搭載 Intel Xeon w5-3435X 處理器的工作站,主機板為華碩 Pro WS W790E-SAGE SE,並配置 128GB DDR5 記憶體,顯示卡驅動程式版本為 Arc Pro 32.0.101.8515,測試分別在 Windows 11 與 Ubuntu 系統環境下進行。

首先在功耗表現上,Hardwareluxx 的測試數據顯示,單張 Arc Pro B70 在閒置狀態下僅消耗約 26W,進行 AI 推論工作負載時約為 180.7W,雙卡合計約 367.7W,而四卡配置的總功耗則來到 720.6W。

intel arc pro b70 quad gpu setup needs up to 720w 1

數字乍看之下驚人,但換個角度來看就顯得合理許多。Arc Pro B70 官方標示的最大板卡功耗為 230W,因此四張卡的理論上限應為 920W,而實測的 720W 仍低於這個理論數字。從整體功耗分配來看,各卡之間的用電量相當平均,顯示系統在負載調度上頗為均衡。

在 AI 工作負載的效能測試中,Arc Pro B70 在 Geekbench AI 的成績較 Arc Pro B50 快上約 30~40%,部分測試中甚至可以與 AMD Radeon Pro W7900 一較高下,而功耗卻顯著低於 Radeon Pro W7800 和 W7900。

在更進階的 MLPerf Client 測試裡,Arc Pro B70 在 Llama 3.1 8B 模型的推論速度上達到每秒 93.5 個 token,雖略遜於 AMD Radeon Pro W7900 的 101.8 tokens/s,但首個 token 的回應延遲僅 0.12 秒,明顯優於測試中列出的 AMD 與 NVIDIA 顯示卡。

在圖片生成的 Procyon 測試中,Arc Pro B70 的 INT8 精度每張圖僅需 1.932 秒,FP16 精度則為 3.029 秒,表現相當出色。

記憶體容量帶來的實際效益同樣不容忽視。Hardwareluxx 的測試也指出,雙卡共 64GB 的 VRAM 雖然仍不足以流暢運行部分 120B 等級的大型模型,但升級至四卡、擁有 128GB 顯示記憶體後,這類工作負載終於能以實用的運算速度正常運行。

然而,並非所有事情都如想像中美好。Windows 系統雖然能順利辨識全部四張顯示卡,但測試中使用的工作站及 AI 效能測試軟體,竟沒有任何一套能夠正確地跨多 GPU 進行擴充運算,就連 Blender 也只能使用到其中一張卡。

多 GPU 擴充目前唯一有意義的測試環境,是在 Ubuntu 系統下透過 LMStudio 進行,但由於顯示卡之間缺乏直接的高速互連,只能透過 PCIe 溝通,因此效能擴充的幅度並非線性成長。這個軟體生態系的不成熟,是目前阻礙 Battlematrix 方案進一步發揮潛力的最大障礙。

從市場定位來看,Intel 將 Arc Pro B70 的建議售價定在每張 949 美元,直接挑戰 NVIDIA RTX Pro 4000 的 1,800 美元與 AMD Radeon AI Pro R9700 的 1,299 美元,在 32GB VRAM 這個規格區間提供明顯更具競爭力的選擇。

以記憶體容量換算,Arc Pro B70 的 32GB VRAM 相比 NVIDIA RTX Pro 4000 的 24GB 多出三分之一,在使用 Llama 3.1 8B BF16 模型時,可支援的上下文長度達到 93K token,而 RTX Pro 4000 在 42K token 時便已記憶體不足。這對於需要處理長文本的 AI 應用場景而言,是相當具體的優勢。

綜觀整體測試結果,Intel Arc Pro B70 在 AI 推論領域展現相當不錯的效能與功耗比,720W 的四卡功耗數字雖然聽起來嚇人,卻是在有效利用記憶體容量、運行超大規模模型的前提下所得到的結果,實際效率並不差。

然而,軟體生態系的不成熟以及 PCIe 多卡通訊瓶頸,仍是這套方案走向主流應用的現實障礙。對於預算有限、需要大容量 VRAM 跑本地 AI 模型的使用者而言,Arc Pro B70 無疑是目前市場上最值得認真考慮的選項之一;但若需要穩定的多 GPU 橫向擴充能力,在軟體支援到位之前,或許還需要多一些耐心等待。

延伸閱讀

歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *