NVIDIA Blackwell GPU 架構正式公佈：2080 億電晶體、5 倍 AI 性能、192GB HBM3e 記憶體、8TB/s 頻寬

段落大綱

NVIDIA Blackwell GPU 的 AI 性能比 Hopper H100 快 5 倍，引領下一代 AI 運算的潮流

NVIDIA 正式公佈了其代號為 Blackwell 的下一代 AI 和 Tensor Core GPU 架構的全部細節。正如預期，Blackwell GPU 是首批採用 NVIDIA 第一個 MCM 設計的產品，將在同一晶片上整合兩個 GPU。其架構特點整理如下：

全球最強大的晶片 – Blackwell 架構的 GPU 擁有 2080 億電晶體，使用台積電客製化 4NP 製程，使用兩個光罩版 GPU 晶片通過每秒 10TB 的晶片間連結整合成一個統一 GPU
第二代 Transformer 引擎 – 在 NVIDIA TensorRT-LLM 和 NeMo Megatron 框架中整合了新的 micro-tensor 縮放支援和 NVIDIA 先進的動態範圍管理演算法，Blackwell 將支援兩倍的運算量和模型大小，並具有新的 4 位浮點 AI 推理能力
第五代 NVLink – 為了加速萬億組參數和混合專家 AI 模型的性能，最新版本的 NVIDIA NVLink 實現了每組 GPU 1.8TB/s 雙向吞吐量，確保多達 576 個 GPU 之間的無縫高速通訊，以處理最複雜的 LLM
RAS 引擎 – 採用 Blackwell 架構的 GPU 包括一個專用引擎，具備可靠、可用和可維修等特性。此外，Blackwell 架構在晶片級別新增了利用基於 AI 的預防性維護來執行診斷和預測可靠性問題的能力。這最大限度地提高了系統正常運行時間，並提高大規模 AI 部署的彈性，可以連續運行數週甚至數月，並降低營運成本
安全 AI – 先進的機密運算功能在不影響性能的情況下保護 AI 模型和客戶資料，支援新的原生介面加密協議，這對醫療保健和金融服務等隱私敏感型產業至關重要
解壓引擎 – 專用的解壓引擎支援最新格式，加速資料庫查詢，提供最高的資料分析和資料科學性能。未來幾年，企業每年在資料處理上花費數百億美元，將越來越多地使用 GPU 加速

深入看看細節，NVIDIA Blackwell GPU 在每個運算晶片上總共有 1040 億個電晶體，採用台積電 4NP 製程製造。B100 GPU 搭載 10 TB/s 的高頻寬介面，允許超快晶片間互連。這些 GPU 在同一封裝上統一為一個晶片，提供高達 2080 億電晶體和完整 GPU 快取一致性。

Blackwell 提供 128 億電晶體、5 倍 AI 性能和 4 倍晶片內記憶體

與 Hopper 相比，NVIDIA Blackwell GPU 多了 128 億個電晶體，AI 性能提高 5 倍，每個晶片可達 20 petaFlops，晶片內記憶體增加了 4 倍。GPU 本身與 8 個 HBM3e 堆疊耦合，通過 8192-bit 匯流排介面提供 8 TB/s 的記憶體頻寬，最高可達 192GB HBM3e 記憶體。與 Hopper 相比，性能數據可以快速總結為：

20 PFLOPS FP8（Hopper 的 2.5 倍）
20 PFLOPS FP6（Hopper 的 2.5 倍）
40 PFLOPS FP4（Hopper 的 5 倍）
7400 億參數（Hopper 的 6 倍）
34T 參數/秒（Hopper 的 5 倍）
7.2 TB/s NVLINK（Hopper 的 4 倍）

NVIDIA 將提供完整 Blackwell GPU 平台，配備 Grace CPU

NVIDIA 將以完整平台形式提供 Blackwell GPU，將兩個 GPU（即四個運算晶片）與單個 Grace CPU（72 個 ARM Neoverse V2 CPU 核心）相結合。GPU 將通過 900 GB/s 的 NVLINK 協議相互連接，並與 Grace CPU 連接。

NVIDIA Blackwell B200 GPU 將於 2024 年推出，配備 192GB HBM3e 記憶體

NVIDIA Blackwell B200 GPU 是將被採用到各種設計中的兩款 Blackwell 晶片中的第一款，包括 SXM 模組、PCIe AIC 和超級晶片平台。B200 GPU 將是 NVIDIA 首款採用晶片設計的 GPU，具有基於台積電 4nm 製程的兩個運算晶片。

NVIDIA Blackwell B200 GPU 將是一款猛獸級晶片，它總共包含 160 個 SM，共 20,480 個核心。該 GPU 將採用最新的 NVLINK 互連技術，支援相同的 8 GPU 架構和 400 GbE 網路交換器。其功耗也將非常高，峰值 TDP 700W，與 H100 和 H200 晶片相同。總結這個晶片特性：

台積電 4NP 製程
多晶片封裝 GPU
單 GPU 1040 億電晶體
雙 GPU 2080 億電晶體
160 個 SM（20,480 個核心）
8 個 HBM 封裝
192GB HBM3e 記憶體
8 TB/s 記憶體頻寬
8192-bit 記憶體匯流排介面
8-Hi Stack HBM3e
支援 PCIe 6.0
峰值 700W TDP

在記憶體方面，Blackwell B200 GPU 將配備高達 192GB 的 HBM3e 記憶體，以八個 8-hi 模組堆疊的形式呈現，每個模組通過 8192-bit 匯流排介面提供 24GB VRAM 容量。與 H100 80GB GPU 相比，將是 2.4 倍的增長，允許晶片運行更大的 LLM 模型。

NVIDIA Blackwell B200 及其相應平台將開創 AI 運算的新時代，並為 AMD 和 Intel 的最新晶片產品提供強勁的競爭。隨著 Blackwell 的推出，NVIDIA 將再次鞏固其作為 AI 市場主導力量的地位。

歡迎加入我們的 Facebook 粉絲團，隨時掌握最新消息!
喜歡看圖說故事的話，也可以追蹤 Instagram 專頁!
我們也有 Google News 可以隨時 follow!

Tags: AI NVIDIA

NVIDIA Blackwell GPU 架構正式公佈：2080 億電晶體、5 倍 AI 性能、192GB HBM3e 記憶體、8TB/s 頻寬

NVIDIA Blackwell GPU 的 AI 性能比 Hopper H100 快 5 倍，引領下一代 AI 運算的潮流

Blackwell 提供 128 億電晶體、5 倍 AI 性能和 4 倍晶片內記憶體

NVIDIA 將提供完整 Blackwell GPU 平台，配備 Grace CPU

NVIDIA Blackwell B200 GPU 將於 2024 年推出，配備 192GB HBM3e 記憶體

相關內容

ASUS ROG Ally X 電競掌機傳將搭載 24GB LPDDR5X 記憶體

RTX 4090 於《Ghost of Tsushima》PC 版中以原生 4K 解析度達 80 FPS，啟用 DLSS 3 RTX ON 後飆破 200 FPS

Intel 下一代 Falcon Shores GPU 功耗高達 1500W，不考慮空冷版本

發佈留言取消回覆

AI 助創意實踐無極限！Lenovo Yoga 創作者筆電在台登場

混合實境新紀元，Meta 推出 Meta Horizon OS 作業系統

Meta Llama 3 正式登場：目前最強大開放式大型語言模型

ZOTAC 將於 2024 年漢諾瓦工業博覽會展示各種工業及醫保運算解決方案

Google Pixel 8「大打折扣」、限時下殺近 NT$8,000 元

2K 現省 2,000！ASUS VG27AQL3A 電競螢幕給你 180Hz + 1ms GTG 快速反應

ROG Ally 電競掌機降價！不用 2 萬帶回家還送三星 512GB 記憶卡、年終獎金就給你了！

現省 2,000、破盤搶先購！AOC C27G2Z 曲面電競螢幕 VA 面板 240Hz 更新率只要 4,388 元

NVIDIA Blackwell GPU 的 AI 性能比 Hopper H100 快 5 倍，引領下一代 AI 運算的潮流

Blackwell 提供 128 億電晶體、5 倍 AI 性能和 4 倍晶片內記憶體

NVIDIA 將提供完整 Blackwell GPU 平台，配備 Grace CPU

NVIDIA Blackwell B200 GPU 將於 2024 年推出，配備 192GB HBM3e 記憶體

相關內容

發佈留言 取消回覆

發佈留言取消回覆