1
1
AMD 今日正式推出旗下新一代 AI 加速器產品 Instinct MI350 系列,包括 MI350X 與旗艦級 MI355X,採用最新的 CDNA 4 架構 與 TSMC 3nm 製程技術,單晶片內含 高達 1850 億個電晶體,並配備 288 GB HBM3E 記憶體,記憶體頻寬達 8 TB/s,進一步強化 AI 推論與訓練效能。
MI350 系列採用 8 顆運算晶粒(XCD) 配置,每顆包含 32 個運算單元(CU),總計達 256 CU 與 16,384 個核心。支援全新 FP4 與 FP6 運算格式,特別針對 AI 推論優化,並搭載最新 UBB8 標準模組化封裝,提供空冷與液冷版本選擇。
此外,兩款晶片均配有 256MB 第四代 Infinity Cache,並以 128 通道的 HBM3E 記憶體提供更穩定的資料傳輸,單顆晶片內建 8 層堆疊,每層 36GB 記憶體,總容量 288GB。
AMD 表示,MI355X 在 Llama 3.1 405B 模型上的推論效能為 MI300X 的 35 倍提升,相當於世代躍進。此外,在 FP4/FP6 模式下,MI355X 的效能為 NVIDIA Blackwell B200 的 2.2 倍,並且在記憶體容量與 FP64 雙精度浮點效能方面也遙遙領先。
| 比較項目 | MI355X vs B200 | 效能倍數 |
|---|---|---|
| 記憶體容量 | 高 1.6x | ✔️ |
| 記憶體頻寬 | 相同 | ➖ |
| FP64 效能 | 高 2.1x | ✔️ |
| FP6 效能 | 高 2.2x | ✔️ |
| FP4 / FP8 | 約高 1.1x | ✔️ |
MI355X 旗艦版提供高達 20 PFLOPs FP6 / FP4 計算能力、10 PFLOPs FP8、5 PFLOPs FP16 與 79 TFLOPs FP64 計算力,TDP 高達 1400W。
一個完整伺服器機櫃配置最多 128–96 顆 MI355X GPU,可達成:
AMD 同步透露,下一代 MI400 系列(可能支援 HBM4 記憶體)預定於 2026 年發表,更進一步升級至 40 PFLOPs FP6 計算力 與 432GB HBM4 @ 19.6TB/s 記憶體頻寬,並將使用更高效能的 UDNA 架構。
歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!