TechSpace 鐵客空間

每日科技新聞新知、硬體開箱評測、賣場優惠!

NVIDIA 告別「GPU 獨霸」時代!GTC 2026 揭示混合運算新紀元:Groq LPU 整合、Feynman 架構

NVIDIA 將在 GTC 2026 大會上宣告終結「一顆 GPU 打天下」的時代!整合 Groq LPU、推出混合運算架構 Vera Rubin,並搶先預覽下一代 Feynman 晶片,加上 Co-Packaged Optics 光互連技術的重磅登場,這場 AI 算力盛會正式揭示 NVIDIA 的全新戰略轉型,成為全球 AI 基礎設施的最強整合平台。
nvidia abandon one gpu does everything gtc 2026

GTC 2026 從「一顆 GPU 包山包海」到混合運算平台,NVIDIA 正式轉型

如果你以為 NVIDIA 只是一家賣 GPU 的公司,那這次 GTC 2026 大會可能會讓你改觀。多年來,NVIDIA 奉行「一顆 GPU 解決所有 AI 運算需求」的策略,但隨著 AI 推論(inference)工作負載愈來愈複雜、對低延遲的要求愈來愈高,單靠 GPU 已難以滿足所有需求。這也是為什麼外界認為 NVIDIA「只靠 GPU」的舊策略已經逐漸過時,尤其是 AI 工作負載的演進正以超乎預期的速度進行。

NVIDIA GTC 2026 大會即將正式登場,執行長黃仁勳(Jensen Huang)親自主持主題演講。這場被業界稱為「AI 界超級盃」的年度科技盛會,今年的核心主軸不只是新一代 GPU,而是一場徹底顛覆 AI 算力架構的戰略宣示。

Groq LPU 正式融入 Vera Rubin,「分解式推論」時代來臨

這次 GTC 最令業界振奮的消息,莫過於 NVIDIA 將把收購自 Groq 的 LPU(語言處理單元)技術,正式整合進旗艦 Vera Rubin 系統。根據預測,NVIDIA 將在 Vera Rubin 平台上推出混合運算托盤配置,內含 LPU 單元,讓 NVIDIA 得以充分發揮「分解式推論」(disaggregated inference)的優勢。目前的推測包括 LPU 將以 64、128 或 256 顆為單位配置於單一運算托盤中,並透過 NVLink Fusion 與 Rubin GPU 連接。

nvidia abandon one gpu does everything gtc 2026 1

LPU 使用晶片上的 SRAM 來提供極高的內部頻寬,使它非常適合處理 AI 推論工作中延遲敏感的「decode(解碼)」階段。而 NVIDIA 現有的 Rubin CPX 平台已能有效加速推論的「prefill(預填充)」階段,兩者相互搭配,恰好補足傳統 AI 推論請求中的兩大關鍵環節。

黃仁勳先前已公開表示,Groq 的整合策略將類似於當年收購 Mellanox 對網路基礎設施的深遠影響。前 Groq 執行長、現任 NVIDIA 首席軟體工程師 Jonathan Ross 更預計在 GTC 大會上以「GPU ♥ LPU:你想知道的一切」為題發表演說,說明兩種架構如何在同一個資料中心內互補共存,分別應對超低延遲與高吞吐量兩種不同需求場景。

Feynman 架構:TSMC A16 製程加持,摩爾定律回歸舞台

另一方面,雖然 Vera Rubin 尚未完全發佈,外界已高度期待 NVIDIA 在此次 GTC 提前揭露下一代 AI 架構「Feynman」的更多細節。這款預計 2028 年量產的架構在 GTC 2025 已略有提及,其中一個重要亮點是 NVIDIA 這次將重新依賴摩爾定律來擴展運算能力。據悉 Feynman 將採用 TSMC 的 A16 製程,而 NVIDIA 預計將成為該製程節點的獨家客戶,因為此節點的適用範圍極為有限。

多份分析報告也指出,Feynman 可能引入矽光子技術,首次在 NVIDIA 產品中以光學訊號取代電訊號進行元件間的資料傳輸,可在極高頻寬下大幅降低功耗。台灣的散熱與電源供應廠商,如 Auras Technology、AVC、Delta Electronics 及 Lite-On Technology 等,都被視為這波硬體升級週期的主要受益者。

Feynman 晶片組還傳出將採用 TSMC 的混合鍵合技術(hybrid bonding),可能採 SoIC 或 EMIB 封裝形式,部分報告甚至指出 Feynman 將直接把 Groq LPU 整合於晶片封裝內部,透過 A16 製程的前側空間堆疊 LPU,實現前所未有的運算密度。

NVL576 超大規模機架與光互連(CPO):網路革命正式啟動

AI 算力的競爭,早已不只是晶片本身的性能比拼,機架規模與互連技術同樣是關鍵戰場。根據預測,GTC 2026 將正式發布四種主要的 Vera Rubin 機架配置,包括 NVL72、NVL144、NVL576 及獨立的 Vera CPU 機架。其中 NVL576 由 8 組 NVL72 組成,第一層採用銅纜連接,第二層則採用 Co-Packaged Optics(CPO)NVSwitch 光互連,標誌著 CPO 正式進入大規模擴展架構的里程碑。

nvidia abandon one gpu does everything gtc 2026 2

NVIDIA 推出的 CPO 交換器旨在突破 576 顆 GPU 配置下銅纜的熱功耗限制,同時大幅提升吞吐量、交換容量與延遲表現。甚至不排除 GTC 2026 將展示 NVL1,152 規格的超大型機架。

CPU 重返舞台中心,Intel 合作案備受矚目

在這場革命中,另一個不可忽視的主角是 CPU。NVIDIA 的 AI 基礎設施負責人 Dion Harris 在接受採訪時直言,CPU 正逐漸成為 AI 與代理式(agentic)工作流程的瓶頸所在,形容這是一個「令人振奮的機會」。NVIDIA 早於 2021 年推出首款資料中心 CPU Grace,而第二代的 Vera CPU 目前已進入量產。

Vera CPU 採用 Arm 架構設計,專為資料密集、需要大量協調與排程的代理式 AI 任務所優化,雖然核心數較競爭對手少(72 核對上競品的 128 核),但在單執行緒效能上更為突出,核心設計哲學是確保昂貴的 GPU 不會因等待 CPU 而閒置浪費。

此外,GTC 大會上也預計將有多項以 CPU 為核心的重量級公告,其中包括 NVIDIA 與 Intel 的合作消息,值得市場高度關注。

綜觀 GTC 2026 的所有預期動向,可以清楚看出 NVIDIA 正在進行一場深層的策略轉型——從過去販售單顆 GPU 晶片的模式,轉向提供整合運算、網路、記憶體、CPU 與 LPU 的全棧式 AI 工廠平台。市場關注的焦點也從單顆晶片的規格比較,轉向 NVL72、NVL144、NVL576 等機架規模的整合配置。

這場 AI 算力的典範轉移,對台灣半導體供應鏈來說更是一大利多,從 TSMC 的先進製程、台達電的電源管理,到各大伺服器 ODM 廠商,都將在這波浪潮中迎來嶄新的成長機會。

延伸閱讀

歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *