NVIDIA Rubin CPX 晶片退出路線圖!Groq LPU 接手推論工作,Feynman 世代有望復活

Rubin CPX 是什麼?為何退出?
在今年的 GTC 大會上,NVIDIA Rubin CPX 晶片意外缺席,執行長黃仁勳在展示 Rubin 產品線時並未提及此款產品。如今,NVIDIA 副總裁 Ian Buck 對此做出說明:Rubin CPX 已暫時退出路線圖,但相關概念將在 Feynman 世代延續。
Rubin CPX 是 NVIDIA 首款以機架為設計核心、搭載 GDDR7 記憶體的 AI 推論晶片,主要針對推論工作負載中的「預填充(prefill)」階段。然而隨著推論市場的需求重心從長上下文逐漸轉向縮短首個 Token 生成時間(TTFT),CPX 的設計目標已與現實需求產生落差,導致 NVIDIA 決定暫緩此計畫。

取而代之的是搭載 Groq LPU 的 Rubin LPX 方案。LPU 採用 SRAM 架構,單節點頻寬高達 150 TB/s,整機架規模下可達 640 TB/s 的擴展頻寬,專注於推論工作的「解碼(decode)」階段,恰好補足了 CPX 退場後的缺口。黃仁勳多次強調 NVIDIA 是「推論之王」,Groq 的加入正是維持這項優勢的重要策略。
Buck 表示,CPX 的概念並未被放棄,只是時機尚未成熟。目前有報導指出,NVIDIA 正在重新設計 CPX 方案,考慮將記憶體從 GDDR7 改為 HBM,未來 Feynman 世代的 CPX 將與原版 Rubin CPX 有所不同。
Rubin CPX 的暫時取消釋出了原本將用於 AI 晶片的 GDDR7 產能,對於正在等待顯示卡的玩家來說,或許是個意外的利多消息。
延伸閱讀
- NVIDIA 重返中國!H200 AI 晶片重啟生產、收到採購訂單,Groq 推論方案五月正式登場
- NVIDIA RTX PRO 4500 Blackwell 伺服器版正式登場!單槽設計塞入 10,496 CUDA 核心與 32GB GDDR7 記憶體
- NVIDIA 押注 AI 推理新戰場:Vera Rubin 聯手 Groq 3 LPX,10 年算力爆增 4000 萬倍

TechSpace 鐵客空間網站編輯,圈內打滾多年,要說是貓奴、狗奴才也是,喜歡科技新品、看開箱,但也喜歡打遊戲的宅宅
歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!
