Popular Posts

AMD Instinct MI350 MI355X Announced

AMD 發表 Instinct MI350 / MI355X:搭載 3nm 製程與 288GB HBM3E,推論效能達 35 倍提升、擊敗 Blackwell B200

Instinct MI350 系列正式發表,MI355X 以 20 PFLOPs 推論效能正面迎擊 NVIDIA Blackwell 系列

AMD 今日正式推出旗下新一代 AI 加速器產品 Instinct MI350 系列,包括 MI350X 與旗艦級 MI355X,採用最新的 CDNA 4 架構 與 TSMC 3nm 製程技術,單晶片內含 高達 1850 億個電晶體,並配備 288 GB HBM3E 記憶體,記憶體頻寬達 8 TB/s,進一步強化 AI 推論與訓練效能。

AMD Instinct MI350 MI355X Announced 1

MI350 系列採用 8 顆運算晶粒(XCD) 配置,每顆包含 32 個運算單元(CU),總計達 256 CU 與 16,384 個核心。支援全新 FP4 與 FP6 運算格式,特別針對 AI 推論優化,並搭載最新 UBB8 標準模組化封裝,提供空冷與液冷版本選擇。

此外,兩款晶片均配有 256MB 第四代 Infinity Cache,並以 128 通道的 HBM3E 記憶體提供更穩定的資料傳輸,單顆晶片內建 8 層堆疊,每層 36GB 記憶體,總容量 288GB。

AMD Instinct MI350 MI355X Announced 2

AMD 表示,MI355X 在 Llama 3.1 405B 模型上的推論效能為 MI300X 的 35 倍提升,相當於世代躍進。此外,在 FP4/FP6 模式下,MI355X 的效能為 NVIDIA Blackwell B200 的 2.2 倍,並且在記憶體容量與 FP64 雙精度浮點效能方面也遙遙領先。

比較項目MI355X vs B200效能倍數
記憶體容量高 1.6x✔️
記憶體頻寬相同
FP64 效能高 2.1x✔️
FP6 效能高 2.2x✔️
FP4 / FP8約高 1.1x✔️

MI355X 旗艦版提供高達 20 PFLOPs FP6 / FP4 計算能力、10 PFLOPs FP8、5 PFLOPs FP16 與 79 TFLOPs FP64 計算力,TDP 高達 1400W。

一個完整伺服器機櫃配置最多 128–96 顆 MI355X GPU,可達成:

  • 36 TB HBM3E 容量
  • 64 TB/s 總頻寬
  • 1.3 ExaFLOPs FP8 計算力
  • 2.6 ExaFLOPs FP4 計算力
  • 搭配 EPYC Turin(Zen 5)CPU 與 Pollara 400 互連技術
AMD Instinct MI350 MI355X Announced 3

AMD 同步透露,下一代 MI400 系列(可能支援 HBM4 記憶體)預定於 2026 年發表,更進一步升級至 40 PFLOPs FP6 計算力 與 432GB HBM4 @ 19.6TB/s 記憶體頻寬,並將使用更高效能的 UDNA 架構。

歡迎加入我們的 Facebook 粉絲團,隨時掌握最新消息!
喜歡看圖說故事的話,也可以追蹤 Instagram 專頁!
我們也有 Threads 可以隨時 follow!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *