TechSpace 鐵客空間

每日科技新聞新知、硬體開箱評測、賣場優惠!

Intel iBOT 工具讓跑分失真?Geekbench 對 Arrow Lake Refresh 處理器成績打上「可能無效」紅字

Intel 為 Arrow Lake Refresh 系列處理器推出的 Binary Optimization Tool(iBOT)引發基準測試公信力危機。知名跑分工具 Geekbench 開發商 Primate Labs 宣布,由於無法判斷測試結果是否啟用了 iBOT,將對所有支援該功能的 CPU 跑分結果標示「可能無效」警告。部分工作負載分數最高可被拉高 40%,嚴重影響與其他處理器的比較公正性,引發科技圈廣泛討論。
geekbench cant replicate arrow lake refresh gains

Arrow Lake Refresh 一個優化工具,掀起基準測試的信任風暴

Intel 最新推出的 Core Ultra 200S Plus 系列處理器(即「Arrow Lake Refresh」),挾帶全新的 Binary Optimization Tool(以下簡稱 iBOT)登場,聲稱可在特定遊戲中大幅提升每時脈指令數(IPC)。然而這項被 Intel 視為突破性技術的功能,卻在上市不久後,就讓知名基準測試平台 Geekbench 陷入了一場公信力危機。

Geekbench 開發商 Primate Labs 創辦人 John Poole 近日在官方部落格發文表示,由於目前完全無法偵測某筆 Geekbench 測試結果是否在啟用 iBOT 的情況下所產生,Primate Labs 決定對所有支援 Binary Optimization Tool 的處理器跑分結果,一律加上可能無效的警示標語。這則警告的具體措辭為:「This benchmark result may be invalid due to binary modification tools that can run on this system.」

要了解這場爭議,必須先釐清 iBOT 的運作方式。iBOT 是 Intel 針對 Core Ultra 200S Plus(Arrow Lake Refresh)和部分 300 系列(Panther Lake)處理器推出的使用者模式效能強化工具。Intel 會在自家實驗室從微架構層級分析特定應用程式,找出編譯後程式碼未達最佳化的指令序列,再將這些指令重新排列,以更充分運用 Intel 獨特的快取、分支預測器及執行單元。

intel core ultra 200s plus 270k plus 250k plus 3

Intel 強調,這個過程中開發者不需要介入,且 Intel 明確表示不會跳過任何運算工作或指令,僅是重新排列順序。換句話說,iBOT 的設計理念是讓現有程式碼在 Arrow Lake 架構上跑得更有效率,而非造假或作弊。

然而問題在於,iBOT 所使用的技術並未對外公開文件說明,外界也不清楚這些技術究竟能廣泛應用到多少不同的應用程式上。這種「黑盒子」作法,讓第三方測試機構難以驗證其結果的可靠性。

Primate Labs 的擔憂並非空穴來風。當 Geekbench 6 在 iBOT 作用下執行時,部分工作負載的子項目分數最高可暴增 40%,整體總分則可提升高達 8%。這樣的成績無法與其他未開啟 iBOT 的裝置進行公平比較,也無法真實反映處理器的實際運算效能。

假設有一顆 Intel Core Ultra 處理器在啟用 iBOT 後拿下 3,700 分的單核心成績,而 AMD 處理器以原生方式取得 3,600 分,畫面上看起來 Intel 勝出,但這已不再是一場公平的較量,簡單來說就是一顆 CPU 跑的是「標準版」測試,另一顆跑的卻是「客製化版」測試。

而這次爭議最棘手之處在於 Geekbench 根本無法從技術上判斷 iBOT 是否在測試期間啟動。Primate Labs 目前對於所有支援 Binary Optimization Tool 的 CPU 所跑出的 Geekbench 6 成績,完全沒有辦法判斷該結果是否在啟用工具的情況下產生,因此決定對全部相關結果加上警告訊息。

Primate Labs 亦說明,雖然 Binary Optimization Tool 目前僅支援少數幾款 Intel CPU,但這是確保 Geekbench 瀏覽器上所呈現分數可信度的重要步驟。由於支援 CPU 名單可能隨時間動態調整,Primate Labs 的警告措施也會隨之更新。

對於 Geekbench 的此番舉動,Intel 方面目前尚未發表正式回應。然而從 Intel 宣傳的角度來看,iBOT 在部分遊戲場景下確實展現相當程度的效能提升。根據 Intel 的內部測試,Core Ultra 7 270K Plus 在《古墓奇兵:暗影》中效能提升高達 39%,在《Hitman 3》中也有 22% 的進步,這兩款遊戲均使用 iBOT 技術。

然而,外界對此仍保持高度警戒。畢竟即便算是黑歷史的一部分,但 Intel 在 benchmark 造假方面確實有前科可循,2024 年,SPEC 因「不公平優化」而判定 Intel 使用特定編譯器的跑分無效;2009 年,Intel 的 ICC 編譯器更被發現會刻意對 AMD 處理器移除所有優化,人為壓低競爭對手的成績。

除了基準測試爭議,iBOT 本身的實用性也受到質疑。在 Intel 的初步測試中,iBOT 僅支援 12 款需要針對個別遊戲建立設定檔的遊戲,這可能成為 iBOT 規模化應用的重大瓶頸。此外,由於 iBOT 涉及二進位層級的程式碼修改,核心層級的反作弊軟體可能將其標記為異常,因此目前也無法支援多人連線遊戲。再加上啟用 iBOT 需要進入進階模式並完成多步驟的啟動流程,對一般使用者而言可能並不友善,這也可能限制其普及率。

這場風波的核心,不只是 Intel 一個工具的問題,也揭露當代 CPU 基準測試生態系的脆弱性。當廠商可以在使用者不知情的情況下,針對特定跑分軟體進行指令層級的優化,所有排行榜上的數字都將蒙上一層陰影。Geekbench 表示,目前正尋求 Intel 提供更深入、更具技術細節的說明,目標是確認這些優化確實具有通用性,且有充分文件可供查驗。對於 Arrow Lake Refresh 的潛在購買者而言,短期內看到的跑分數字,或許真的需要多打一個問號。

延伸閱讀

歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *