《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > 深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

2020-11-17
來源:機器之心
關鍵詞: AMD GPU

  AMD 發布 Instinct MI100 加速器,它使用最新 Matrix Core 技術,是面向 HPC 和 AI 的新型加速系統。AMD 表示這是全球最快的 HPC GPU,也是首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

微信圖片_20201117143945.png

  當前,GPU 已經成為深度學習訓練的標配,而針對深度學習中的 Tensor 操作,各大廠商在設計軟硬件時都會做特別優化,其中知名的就是英偉達的 Tensor Core。

  今日,對標英偉達 Tensor core,一直發展迅猛的 AMD 也推出了類似功能單元 Matrix Core。同時,基于 Matrix Core 技術,AMD 發布了新型 AMD Instinct MI100 加速器,據稱是全球最快的 HPC GPU 和首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

  據 AMD 官方介紹,AMD Instinct MI100 GPU 配備了全新 AMD CDNA 架構,使用第二代 AMD EPYC 處理器,是面向 HPC 和 AI 的新型加速系統。

  在性能上,MI100 為 HPC 提供了高達 11.5 TFLOPS 的 FP64 峰值性能,為 AI 和機器學習提供了高達 46.1 TFLOPS 的 FP32 Matrix 峰值性能。

  與 AMD 的上一代加速器相比,MI100 憑借新的 AMD Matrix Core 技術,為 AI 訓練提供了近 7 倍的 FP16 理論峰值浮點性能提升。

2.png

3.png

  AMD Instinct MI100 為 HPC 和 AI 提供優秀的性能(圖源:https://www.amd.com/zh-hans/products/server-accelerators/instinct-mi100)

  MI100 的具體規格參見下表:

4.jpg

  AMD 數據中心 GPU 和加速處理公司副總裁 Brad McCredie 表示:「AMD Instinct MI100 的推出,標志著 AMD 朝著百億億級計算邁出了重要的一步。這款新型加速器專為科學計算中重要的工作負載打造,結合 AMD ROCm 開放軟件平臺后,能夠為科學家和研究人員在 HPC 中的工作提供堅實的基礎。」

  此外,AMD 還推出了 ROCm 4.0。ROCm 開發者軟件平臺旨在為百億億級計算提供基礎,包括編譯器、編程 API 和庫。此次推出的 ROCm 4.0 針對基于 MI100 的系統進行了優化,將編譯器升級為開源版本,并支持 OpenMP 5.0 和 HIP。經過 ROCm 4.0 優化,PyTorch 和 Tensorflow 框架可以基于 MI100 實現更高的性能。

  AMD Instinct MI100 加速器的特性

  以下是 AMD Instinct MI100 加速器的關鍵能力和特性:

微信圖片_20201117143958.png

  AMD Instinct MI100 的關鍵特性一覽表(圖源:https://www.amd.com/system/files/documents/instinct-mi100-brochure.pdf)

  全新的 AMD CDNA 架構:該架構專為 AMD GPU 適應百億億級計算時代而打造,是 MI100 加速器的核心,能夠提供卓越的性能和能效。

  適應 HPC 工作負載的 FP64 和 FP32 頂尖性能:峰值 FP64 和峰值 FP32 的性能分別達到 11.5 TFLOPS 和 23.1 TFLOPS,行業領先。

  全新的 Matrix Core 技術:適合多種單精度和混合精度矩陣運算(如 FP32、FP16、bFloat16、Int8 和 Int4)的超強性能,從而提升 HPC 和 AI 的收斂性能。

  第二代 AMD Infinity Fabric 技術:Instinct MI100 提供大約二倍的 PCIe 4.0 接口 P2P 峰值 I/O 帶寬,每塊 GPU 配置三條 AMD Infinity Fabric 總線,總帶寬高達 340 GB/s。在服務器上,MI100 GPU 可以配置兩個全連接 quad GPU hive,每個提供高達 552 GB/s 的 P2P I/O 帶寬,從而實現快速數據共享。

  超快 HBM2 內存:32GB 高帶寬 HBM2 內存,時鐘速率為 1.2 GHz,可以提供超高的 1.23 TB/s 內存帶寬,以支持大型數據集,并消除數據進出內存的瓶頸。

  支持業內最新的 PCIe Gen 4.0:支持最新的 PCIe Gen 4.0 技術,提供高達 64GB/s 的 CPU 到 GPU 理論數據傳輸帶寬。

  原文鏈接:https://ir.amd.com/news-events/press-releases/detail/981/amd-announces-worlds-fastest-hpc-accelerator-for

  Amazon SageMaker 1000元大禮包

  ML訓練成本降90%,被全球上萬家公司使用,Amazon SageMaker是全托管機器學習平臺,支持絕大多數機器學習框架與算法,并且用 IDE 寫代碼、可視化、Debug一氣呵成。

  現在,我們準備了1000元的免費額度,開發者可以親自上手體驗,讓開發高質量模型變得更加輕松。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 扒开女人双腿猛进猛出免费视频| 亚洲欧美久久一区二区| 五月婷婷在线观看| 青草视频免费看| 曰批全过程免费视频网址| 国产三级电影在线观看| www.狠狠插| 欧美日本免费观看αv片| 国产孕妇做受视频在线观看| 中国一级片在线观看| 爱福利极品盛宴| 国产男女视频在线观看| 中文字幕网在线| 爱情岛永久免费| 国产一卡2卡3卡四卡高清| eeuss影院机在线播放| 欧美jizz18欧美| 四虎国产精品成人| 97精品一区二区视频在线观看| 日韩电影免费在线观看网站 | 久久夜色精品国产欧美| 精品国产乱码久久久久久浪潮| 国产精选午睡沙发系列999| 久久精品人人爽人人爽| 精品久久久噜噜噜久久久| 国产精品国产三级专区第1集| 久久久久久久99精品免费观看| 琪琪色在线播放| 国产日韩在线观看视频网站| 一级做a爱一区| 欧美一级高清片在线| 啊快点再快点好深视频免费| 91香蕉成人免费网站| 日本tvvivodes人妖| 亚洲综合久久成人69| 高潮毛片无遮挡高清免费视频 | 久久精品无码专区免费| 真正全免费视频a毛片| 国产日韩视频在线观看| 999精品视频在线观看热6| 怡红院老首页主页入口|