TechSpace 鐵客空間

每日科技新聞新知、硬體開箱評測、賣場優惠!

AMD RDNA 5 架構大突破:靠 Dual Issue VALU 技術讓 GPU 效能最高翻倍,以智取勝不靠蠻力

AMD 最新 RDNA 5 架構透過強化版 Dual Issue VALU 技術與全新 VOPD3 指令格式,讓 GPU 在單一時脈週期內同時執行兩道運算指令,有效 FP32 效能有機會在特定工作負載下提升近一倍。
amd rdna 5 launch mid 2027 tsmc n3p node rumor

RDNA 5 導入的 Dual Issue VALU 是什麼?為何過去派不上用場?

AMD 向來以堆疊硬體規格來提升顯示卡效能,但這次他們打算換一套玩法。根據近期在 Linux 開源社群曝光的一份 LLVM 程式碼修補檔案,AMD 正在為下一代 RDNA 5 架構導入 Dual Issue 關鍵改良,讓 GPU 在某些特定工作負載下,有機會在不增加任何實體運算單元的前提下,將有效 FP32 效能提升將近一倍。

要理解這次的突破,得先從「Dual Issue VALU, Vector Arithmetic Logic Unit)」的概念說起。簡單來說,Dual Issue 技術讓 GPU 在部分情況下,能在同一個時脈週期內同時執行兩道數學運算,而非一次只處理一道。理論上來說,這等同於讓運算單元的吞吐量翻倍,是相當吸引人的效能紅利。

然而,自 RDNA 3 架構起,AMD 就已將 Dual Issue 功能內建於其 GPU 設計中,但對多數使用者、尤其是遊戲玩家而言,這個功能實際上幫助相當有限。問題出在哪裡?關鍵在舊有的 Dual Issue 設計限制重重:它只支援較少的指令類型、必須在 Wave32 模式下運作,並且有額外的暫存器規則阻礙其正常發揮。

最具代表性的例子是:一個重要的 FP32 指令「V_FMA_F32」並不在舊有的支援路徑之中,導致某些效能測試工具(如 vkpeak)所量測到的 FP32 峰值效能,有時只有 GPU 官方標稱值的一半左右。換句話說,AMD 顯示卡在帳面規格與實際跑出來的數字之間,存在著一道明顯的鴻溝。

AMD 正在為 RDNA 5 加入一種名為「VOPD3」的全新指令格式,其設計目的正是為了讓雙發射 VALU 更容易被編譯器所利用。

現行的 VOPD 系統大致上只能搭配較簡單的 2 運算元指令運作,讓編譯器很難排程出合適的指令配對。VOPD3 將把支援範圍擴展至 3 運算元指令,從而能夠支援融合乘加(FMA)等運算。編譯器在產生程式碼時,將擁有更大的彈性來配對指令,大幅提升 Dual Issue 實際被觸發的機率。

而 RDNA 5 的目標是縮小現有的這道差距,讓編譯器能產生更合適的指令配對,同時讓硬體更有效率地執行它們。在特定情境下,這可能帶來有效 FP32 效能的顯著提升。

這道難題的複雜程度,從一個有趣的案例中可見一斑。Sony 在開發 PlayStation 5 Pro 時,選擇不啟用 Dual Issue 支援,正是因為在舊有架構下實作這項功能過於困難。雖然 Dual Issue 理論上能讓系統峰值 TFLOPS 翻倍,但開發者根本無法輕易從中獲益,因此 Sony 最終選擇放棄這個功能。

隨著 RDNA 5 準備到來,遊戲玩家與開發者將能取用 AMD 更多的最大運算潛力。此外,RDNA 5(gfx1310)也針對 Dual Issue 的限制進行部分鬆綁,允許相同的輸入暫存器同時指定給 X 側與 Y 側,這也將進一步增加 Dual Issue 被使用的場合。

值得注意的是,在 RDNA 5 正式推出之前,開發者並沒有動力專門針對 AMD 的 Dual Issue 實作來優化其工作負載。畢竟,支援 AMD Dual Issue 的 GPU 在整個 PC 遊戲市場中只佔一小部分。但 RDNA 5 問世後,可能會讓情況有所不同,它將橫跨 Xbox、PlayStation 與 PC 三大平台,形成更具吸引力的開發生態系。

當然,在興奮之餘,我們也需要保持一份冷靜,這樣的改變並不代表 GPU 的額定峰值效能就此翻倍。理論峰值效能仍然由實體運算單元的數量所決定。真正改變的,是這些運算單元在實際使用時達到滿載的機率。換句話說,這顆 GPU 的進步在於更善用既有的上限,而非把上限往上推。當然,這終究只是理論推測,實際成效仍取決於最終的軟硬體整合實作。

從 RDNA 5 目前透露的跡象來看,AMD 不僅著眼於透過增加更多著色器或提高時脈頻率來追求傳統的原始效能,同時也在指令處理層面進行根本性的改變,目標是讓現有硬體得到更有效率的利用,並在某些工作負載下達到顯著更高的實際效能。

另外,除了 Dual Issue 的改進外,AMD 也已公開揭示了 RDNA 5 架構將搭載的三項新技術:Neural Arrays(神經陣列,用於 AI 加速運算)、Radiance Cores(光線追蹤專用硬體加速核心),以及 Universal Compression(通用壓縮技術,大幅降低記憶體頻寬需求)。這三項技術同樣預計將出現在 Sony 下一代 PlayStation(Orion)與 Microsoft 下一代 Xbox(Magnus)的 SoC 晶片中。

目前外界預期 RDNA 5 架構將於 2027 年中正式推出,並採用台積電 N3P 製程。在正式亮相之前,這道由程式碼修補所揭示的「Dual Issue」秘技,或許已足以讓人對 AMD 下一代顯示卡充滿期待。

延伸閱讀

歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *