TechSpace 鐵客空間

每日科技新聞新知、硬體開箱評測、賣場優惠!

蘋果與 NVIDIA 攜手研發 ReDrafter 技術,提升 2.7 倍大型語言模型性能

蘋果與 NVIDIA 正在合作開發名為 ReDrafter 的技術,旨在透過推測解碼方法加速大型語言模型(LLM)的推理過程,提升 AI 性能
蘋果與 NVIDIA 攜手研發 ReDrafter 技術,提升大型語言模型性能

蘋果與 NVIDIA 攜手研發 ReDrafter 技術

蘋果表示與 NVIDIA 正攜手合作,研究名為 ReDrafter 的新技術,目標是透過改進文本生成效率來提升大型語言模型(LLM)性能。此創新技術目前已整合至 NVIDIA TensorRT-LLM 推理加速框架中,顯著提高運算速度並降低能耗。

ReDrafter 技術結合 Beam Search 和 Tree Attention 兩種算法,用於提升文本生成性能。其核心優勢包括:

  • 高效生成:通過加速生成 token 速度實現高效推理。
  • 降低延遲與功耗:減少用戶在使用 LLM 時可能遇到的延遲,並有效降低 GPU 使用數量與能耗。

根據基準測試,ReDrafter 技術在 NVIDIA GPU 上運行數百億參數的生產模型時,可實現 2.7 倍的 token 生成速度提升,特別在貪婪解碼模式(Greedy Decoding)中表現卓越。

Apple and NVIDIA ReDrafter 1

為支援 ReDrafter 技術的應用,NVIDIA 對 TensorRT-LLM 框架進行多項優化,包括新增或曝光先前未使用的操作算子,使其能更好地支援複雜模型與解碼方法。ML 開發者現在可利用 TensorRT-LLM 框架中的 ReDrafter 技術,將其應用於生產環境中的大型語言模型,提升運算效率。

儘管蘋果通常專注於其自家技術(如未來的 M4 Ultra 晶片),但這次合作也顯示兩家公司願意在特定領域達成共同目標。然而,長期合作的可能性仍然存疑,這更像是一種針對單一技術的短期合作模式,就目前蘋果在 AI 領域仍處在落後階段來看,這樣的合作應該還是必要的。

歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Google News 可以隨時 follow!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *