《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > DeepSeek推理任務中昇騰910C已達英偉達H100性能的60%

DeepSeek推理任務中昇騰910C已達英偉達H100性能的60%

2025-02-06
來源:芯智訊
關鍵詞: Deepseek GPU 昇騰 英偉達

1.jpeg

2月5日消息,據tomshardware等多家媒體報道, 華為最新的AI處理器昇騰910C(Ascend 910C)的推理性能已經達到了英偉達(NVIDIA)H100 GPU的60%。雖然昇騰910C性能與英偉達最新的Blackwell系列AI芯片相比仍有很大差距,但它有助于降低中國對英偉達GPU的依賴。

根據DeepSeek 研究人員的測試數據顯示,在執行基于DeepSeek模型的推理任務中,昇騰910C性能可達到英偉達H100的60%。

這顯示出,華為盡管受美國的制裁,無法獲得臺積電的先進制程技術的支持,華為AI處理器的能力仍在快速進步。據介紹,昇騰910C采用chiplet封裝,整合約530億個晶體管。過去昇騰910芯片采用臺積電N7+制程,而昇騰910C芯片則由中芯國際第二代7納米級(N+2)制程制造。

若透過手動優化CUNN核心,昇騰910C性能還可進一步提升。此外,DeepSeek 對升騰處理器的原生支持,以及其PyTorch儲存庫可讓CUDA到CUNN無縫轉換,讓華為硬件更容易整合到AI工作流程中。

據了解,DeepSeek的支持為華為芯片帶來了關鍵優勢: 從第一天起就支持華為昇騰芯片,自主維護PyTorch倉庫,只需一行代碼就能將CUDA轉換為CANN;而且性能優化潛力巨大,通過定制優化可達到更高性能。

據華為官網介紹, CANN(Compute Architecture for Neural Networks)是昇騰針對AI場景推出的異構計算架構 ,對上支持多種AI框架,對下服務AI處理器與編程,發揮承上啟下的關鍵作用,是提升昇騰AI處理器計算效率的關鍵平臺。同時針對多樣化應用場景,提供高效易用的編程接口,支持用戶快速構建基于昇騰平臺的AI應用和業務。

據了解,CANN分社區版和商用版。 前者是快速提供新特性的體驗版,供開發者提前試用;而后者是滿足商用標準的穩定版本。目前,CANN社區版已經來到了8.0.0.alpha003版本,針對Ascend C進行了特性增強。而商用版CANN 8.0.RC3版本也已經發布,新增適配7個操作系統,簡化了CANN安裝流程。

DeepSeek的Yuchen Jin表示,“長周期訓練的穩定性是中國芯片最大難關”。這涉及英偉達軟硬體生態系統的深度整合,CUDA護城河已經發展二十多年。雖然推理性能可繼續改善,但持續的訓練工作負載需要華為進一步改進軟硬體堆疊。

有專家預測,隨著AI模型向“Transformer構架”(如GPT、BERT等)靠攏,CUDA和PyTorch編譯器的重要性將降低。此外,DeepSeek 團隊在軟硬體優化方面的專長,也可能大幅降低對英偉達CUDA的依賴,大幅節省成本。

此前的研究顯示,DeepSeek使用英偉達的H800芯片訓練時,使用英偉達底層硬件指令PTX(Parallel Thread Execution)語言,而非高級編程語言CUDA。這似乎也意味著DeepSeek繞過了CUDA,使用更底層的編程語言做優化。

對于程序開發人員來說,CUDA是一種更加友好的高級語言,開發者只需要專注于程序和算法最相關的運行邏輯,而不太需要考慮具體的程序是如何在GPU等硬件上具體如何執行計算的,從而能夠降低開發難度。而PTX在接近匯編語言的層級運行,允許進行細粒度的優化,如寄存器分配和Thread / Warp級別的調整。這種編程非常復雜且難以維護,所以行業通用的做法是使用CUDA這樣的高級編程語言。

北京航空航天大學副教授黃雷表示,繞過CUDA可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細粒度的操作。這也說明DeepSeek擁有一些擅長寫PTX語言的內部開發者。 假如它之后使用國產GPU,其在硬件適配方面將會更得心應手,其只要了解這些硬件驅動提供的一些基本函數接口 , 就可以仿照英偉達GPU硬件的編程接口去寫相關的代碼,從而讓自家大模型更加容易適配國產硬件。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 艾粟粟小青年宾馆3p上下| 一区二区三区精品视频| 用舌头去添高潮无码视频| 在线观看亚洲视频| 亚洲一本之道高清乱码| 精品国产一区二区三区无码| 国产成人无码AV一区二区| 99久久亚洲综合精品成人网| 成人影院久久久久久影院| 久久精品这里热有精品2015| 波多野结衣av无码久久一区| 国产一级性生活| 777奇米四色| 成人精品一区二区三区中文字幕| 亚洲精品午夜久久久伊人| 韩国全部三级伦电影在线播放| 国产综合成人亚洲区| 一女多男np疯狂伦交| 日本边添边摸边做边爱喷水 | 国产一级特黄高清免费下载| 99久久精品免费看国产一区二区三区 | 欧美顶级aaaaaaaaaaa片| 可播放的免费男男videos不卡| 97性无码区免费| 性色av一区二区三区| 久久精品中文字幕首页| 欧美成人免费全部观看在线看| 停不了的爱在线观看高清| 麻豆国产尤物AV尤物在线观看 | 五月婷婷丁香在线| 福利网址在线观看| 国产一区二区三区视频在线观看| 5566电影成年私人网站| 好男人在线神马影视在线观看www 好男人在线观看高清视频www | 色狠狠色狠狠综合天天| 在公交车上弄到高c了漫画| 一边摸一边叫床一边爽| 日本不卡中文字幕| 九色国产在视频线精品视频| 欧美日韩一区二区三区在线视频| 免费人成在线观看播放国产|