《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > 深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

2020-11-17
來源:機器之心
關鍵詞: AMD GPU

  AMD 發布 Instinct MI100 加速器,它使用最新 Matrix Core 技術,是面向 HPC 和 AI 的新型加速系統。AMD 表示這是全球最快的 HPC GPU,也是首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

微信圖片_20201117143945.png

  當前,GPU 已經成為深度學習訓練的標配,而針對深度學習中的 Tensor 操作,各大廠商在設計軟硬件時都會做特別優化,其中知名的就是英偉達的 Tensor Core。

  今日,對標英偉達 Tensor core,一直發展迅猛的 AMD 也推出了類似功能單元 Matrix Core。同時,基于 Matrix Core 技術,AMD 發布了新型 AMD Instinct MI100 加速器,據稱是全球最快的 HPC GPU 和首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

  據 AMD 官方介紹,AMD Instinct MI100 GPU 配備了全新 AMD CDNA 架構,使用第二代 AMD EPYC 處理器,是面向 HPC 和 AI 的新型加速系統。

  在性能上,MI100 為 HPC 提供了高達 11.5 TFLOPS 的 FP64 峰值性能,為 AI 和機器學習提供了高達 46.1 TFLOPS 的 FP32 Matrix 峰值性能。

  與 AMD 的上一代加速器相比,MI100 憑借新的 AMD Matrix Core 技術,為 AI 訓練提供了近 7 倍的 FP16 理論峰值浮點性能提升。

2.png

3.png

  AMD Instinct MI100 為 HPC 和 AI 提供優秀的性能(圖源:https://www.amd.com/zh-hans/products/server-accelerators/instinct-mi100)

  MI100 的具體規格參見下表:

4.jpg

  AMD 數據中心 GPU 和加速處理公司副總裁 Brad McCredie 表示:「AMD Instinct MI100 的推出,標志著 AMD 朝著百億億級計算邁出了重要的一步。這款新型加速器專為科學計算中重要的工作負載打造,結合 AMD ROCm 開放軟件平臺后,能夠為科學家和研究人員在 HPC 中的工作提供堅實的基礎。」

  此外,AMD 還推出了 ROCm 4.0。ROCm 開發者軟件平臺旨在為百億億級計算提供基礎,包括編譯器、編程 API 和庫。此次推出的 ROCm 4.0 針對基于 MI100 的系統進行了優化,將編譯器升級為開源版本,并支持 OpenMP 5.0 和 HIP。經過 ROCm 4.0 優化,PyTorch 和 Tensorflow 框架可以基于 MI100 實現更高的性能。

  AMD Instinct MI100 加速器的特性

  以下是 AMD Instinct MI100 加速器的關鍵能力和特性:

微信圖片_20201117143958.png

  AMD Instinct MI100 的關鍵特性一覽表(圖源:https://www.amd.com/system/files/documents/instinct-mi100-brochure.pdf)

  全新的 AMD CDNA 架構:該架構專為 AMD GPU 適應百億億級計算時代而打造,是 MI100 加速器的核心,能夠提供卓越的性能和能效。

  適應 HPC 工作負載的 FP64 和 FP32 頂尖性能:峰值 FP64 和峰值 FP32 的性能分別達到 11.5 TFLOPS 和 23.1 TFLOPS,行業領先。

  全新的 Matrix Core 技術:適合多種單精度和混合精度矩陣運算(如 FP32、FP16、bFloat16、Int8 和 Int4)的超強性能,從而提升 HPC 和 AI 的收斂性能。

  第二代 AMD Infinity Fabric 技術:Instinct MI100 提供大約二倍的 PCIe 4.0 接口 P2P 峰值 I/O 帶寬,每塊 GPU 配置三條 AMD Infinity Fabric 總線,總帶寬高達 340 GB/s。在服務器上,MI100 GPU 可以配置兩個全連接 quad GPU hive,每個提供高達 552 GB/s 的 P2P I/O 帶寬,從而實現快速數據共享。

  超快 HBM2 內存:32GB 高帶寬 HBM2 內存,時鐘速率為 1.2 GHz,可以提供超高的 1.23 TB/s 內存帶寬,以支持大型數據集,并消除數據進出內存的瓶頸。

  支持業內最新的 PCIe Gen 4.0:支持最新的 PCIe Gen 4.0 技術,提供高達 64GB/s 的 CPU 到 GPU 理論數據傳輸帶寬。

  原文鏈接:https://ir.amd.com/news-events/press-releases/detail/981/amd-announces-worlds-fastest-hpc-accelerator-for

  Amazon SageMaker 1000元大禮包

  ML訓練成本降90%,被全球上萬家公司使用,Amazon SageMaker是全托管機器學習平臺,支持絕大多數機器學習框架與算法,并且用 IDE 寫代碼、可視化、Debug一氣呵成。

  現在,我們準備了1000元的免費額度,開發者可以親自上手體驗,讓開發高質量模型變得更加輕松。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产人妖另类在线二区| 天天射综合网站| 亚洲日本久久一区二区va| 色婷婷综合久久久| 国产精品亚洲精品青青青| 一本大道AV伊人久久综合| 曰批免费视频播放免费| 亚洲精品网站在线观看你懂的 | 18禁免费无码无遮挡不卡网站| 成人影片一区免费观看| 亚洲AV无码之日韩精品| 波多野结衣av无码久久一区| 啊v在线免费观看| 啦啦啦手机在线中文观看| 亚洲中文字幕久久无码| 福利午夜国产网站在线不卡| 国产免费人人看大香伊| 337p欧美日本超大胆艺术裸| 好男人影视在线WWW官网| 久久亚洲国产视频| 欧美在线综合视频| 伊人激情久久综合中文字幕| 色偷偷成人网免费视频男人的天堂 | 日韩av激情在线观看| 亚洲欧美日韩在线不卡| 精品久久久久久中文字幕大豆网| 国产午夜毛片一区二区三区| 窝窝女人体国产午夜视频| 在线观看精品视频看看播放| 三级视频网站在线观看| 日本欧美成人免费观看| 亚洲午夜无码久久久久| 波多野结衣黑丝| 公和我做好爽添厨房在线观看| 色综合久久88色综合天天| 国产成人影院在线观看| 19禁啪啪无遮挡免费网站| 在车子颠簸中进了老师的身体| 一级毛片免费观看不收费| 无翼乌无遮挡h肉动漫在线观看| 亚州三级久久电影|