NVIDIA Blackwell AI 訓練效能比 Hopper 快 2.2 倍,刷新多項世界紀錄

NVIDIA Blackwell AI 訓練效能刷新多項世界紀錄
NVIDIA Blackwell GPU 在 MLPerf v4.1 AI 訓練基準測試中大放異彩,性能相較於上一代 Hopper GPU 提升了 2.2 倍,刷新多項紀錄,並持續領先業界。隨著 AI 模型對計算需求的急速增長,NVIDIA 不僅在推進 AI 訓練和推論效率方面表現優異,還展示了其 Nyx AI 超級電腦的出色能力。

NVIDIA 此次的 MLPerf v4.1 AI 訓練基準測試包含多種熱門任務,例如 Llama 2 大語言模型微調、Stable Diffusion 影像生成、BERT 自然語言處理、GPT-3 大語言模型的預訓練等。在這些任務中,Blackwell GPU 展現優異效能,尤其是在 Llama 2 70B 微調上,比 Hopper H100 快了 2.2 倍,而 GPT-3 175B 預訓練的表現也提升至 Hopper 的兩倍。



NVIDIA 使用 DGX B200 系統搭建的 Nyx AI 超級電腦,在此次測試中打破了七項記錄。這一新架構通過更高的單顆 GPU 計算吞吐量及更快的高頻寬記憶體,顯著縮減訓練時間。在 GPT-3 175B 訓練基準測試中,僅 64 顆 Blackwell GPU 即可達到與 256 顆 Hopper GPU 同等的效能。此外,NVIDIA 特別針對 AI 核心演算法,優化 Tensor Core 的運算核心,進一步加強 Blackwell 的 AI 訓練效能。

NVIDIA 還透露了其未來的 AI 設備計劃,包括更高效能的 Blackwell Ultra 系統,預計搭載 288GB 的 HBM3e 記憶體及強化運算能力,並將於 2025 年問世。而下一代 Rubin 計劃於 2026 年登場,配備 8S 及 12S HBM4 版本以持續推動 AI 訓練的效能上限。

NVIDIA 的 Blackwell 系列不僅是一顆晶片,更是資料中心及超級運算集群解決方案的重要支柱。隨著 Blackwell 進入全面量產階段,NVIDIA 預期將在未來幾季創下更高的收入與性能記錄。
歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Google News 可以隨時 follow!