《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > 主流深度學習芯片的優缺點分析

主流深度學習芯片的優缺點分析

2017-02-18

深度學習全稱深度神經網絡,本質上是多層次的人工神經網絡算法,即模仿人腦的神經網絡,從最基本的單元上模擬了人類大腦的運行機制。近年來,其所取得的前所未有的突破掀起了人工智能新一輪的發展熱潮。

最早的神經網絡的思想起源于 1943 年的 MCP 人工神經元模型,當時是希望能夠用計算機來模擬人的神經元反應的過程,但直到最近,它才真正讓人工智能火起來。主要原因在于:算法的突破、數據量的激增和計算機能力/成本的下降。其中計算能力的提升的作為人工智能實現的物理基礎,對人工智能發展的意義不言而喻。

本文我們就來分析目前主流的深度學習芯片的優缺點。

CPU 不適合深度學習

深度學習與傳統計算模式最大的區別就是不需要編程,它是從輸入的大量數據中自發地總結出規律,而傳統計算模式更多都需要人為提取所需解決問題的特征或者總結規律來進行編程。也正因為如此,深度學習對計算能力要求非常高,以至于有人將深度學習稱之為“暴力計算”。

因此,傳統的 CPU 并不適用于深度學習。

從內部結構上來看,CPU 中 70%晶體管都是用來構建 Cache(高速緩沖存儲器)和一部分控制單元,負責邏輯運算的部分(ALU 模塊)并不多。控制單元等模塊的存在都是為了保證指令能夠一條接一條的有序執行。

這種通用性結構對于傳統的編程計算模式非常適合,但對于并不需要太多的程序指令,卻需要海量數據運算的深度學習的計算需求,這種結構就顯得有心無力了。

GPU 深度學習主流芯片

與 CPU 少量的邏輯運算單元相比,GPU 整個就是一個龐大的計算矩陣,GPU 具有數以千計的計算核心、可實現 10-100 倍應用吞吐量,而且它還支持對深度學習至關重要的并行計算能力,可以比傳統處理器更加快速,大大加快了訓練過程。GPU 是目前最普遍采用的深度學習運算單元之一。

目前,谷歌、Facebook、微軟、Twitter 和百度等互聯網巨頭,都在使用 GPU 作為其深度學習載體,讓服務器學習海量的照片、視頻、聲音文檔,以及社交媒體上的信息,來改善搜索和自動化照片標記等各種各樣的軟件功能。而某些汽車制造商也在利用這項技術開發無人駕駛汽車。

不過,由于 GPU 的設計初衷是為了應對圖像處理中需要大規模并行計算。因此,根據樂晴智庫介紹,其在應用于深度學習算法時有數個方面的局限性:

第一, 應用過程中無法充分發揮并行計算優勢。深度學習包含訓練和應用兩個計算環節,GPU 在深度學習算法訓練上非常高效,但在應用時一次性只能對于一張輸入圖像進行處理, 并行度的優勢不能完全發揮。

第二, 硬件結構固定不具備可編程性。深度學習算法還未完全穩定,若深度學習算法發生大的變化,GPU 無法靈活的配置硬件結構。

另外,在能耗上面,雖然 GPU 要好于 CPU,但其能耗仍舊很大。

備受看好的 FPGA

FPGA,即現場可編輯門陣列,是一種新型的可編程邏輯器件,由于其具有靜態可重復編程和動態在系統重構的特性,使得硬件的功能可以像軟件一樣通過編程來修改。

FPGA 作為人工智能深度學習方面的計算工具,主要原因就在于其本身特性:可編程專用性,高性能,低功耗。

北京大學與加州大學的一個關于 FPGA 加速深度學習算法的合作研究。展示了 FPGA 與 CPU 在執行深度學習算法時的耗時對比。在運行一次迭代時,使用 CPU 耗時 375 毫秒,而使用 FPGA 只耗時 21 毫秒,取得了 18 倍左右的加速比。

根據瑞士蘇黎世聯邦理工學院 (ETHZurich) 研究發現,基于 FPGA 的應用加速比 CPU/GPU 方案,單位功耗性能可提升 25 倍,而時延則縮短了 50 到 75 倍,與此同時還能實現出色的 I/O 集成。而微軟的研究也表明,FPGA 的單位功耗性能是 GPU 的 10 倍以上,由多個 FPGA 組成的集群能達到 GPU 的圖像處理能力并保持低功耗的特點。

根據英特爾預計,到 2020 年,將有 1/3 的云數據中心節點采用 FPGA 技術。

不可估量的 ASIC

ASIC(Application Specific Integrated Circuits,專用集成電路),是指應特定用戶要求或特定電子系統的需要而設計、制造的集成電路。ASIC 用于專門的任務,比如去除噪聲的電路,播放視頻的電路,但是 ASIC 明顯的短板是不可更改任務。但與通用集成電路相比,具有以下幾個方面的優越性:體積更小、功耗更低、可靠性提高、性能提高、保密性增強、成本降低。

從算力上來說,ASIC 產品的計算能力是 GK210 的 2.5 倍。功耗上,ASIC 功耗做到了 GK210 的 1/15。

當然 ASIC 是能效最高的,但目前,都在早期階段,算法變化各異。想搞一款通用的 ASIC 適配多種場景,還是有很多路需要走的。但從比特幣挖礦機經歷的從 CPU、GPU、FPGA 到最后 ASIC 的四個階段來推論,ASIC 將是人工智能發展的重要趨勢之一。另外,在通信領域,FPGA 曾經也是風靡一時,但是隨著 ASIC 的不斷發展和蠶食,FPGA 的份額和市場空間已經岌岌可危。

據了解,谷歌最近曝光的專用于人工智能深度學習計算的 TPU,其實也是一款 ASIC。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 欧美不卡视频在线| 午夜在线观看福利| 国产成人av在线免播放观看| 国产成人无码av| 国产乱人伦app精品久久| 和黑帮老大365天完整版免费| 免费人成视频在线| 亚洲午夜精品久久久久久人妖 | 99在线精品一区二区三区| 18禁强伦姧人妻又大又| 91精品视频免费| 糟蹋顶弄挣扎哀求np| 欧美色图综合网| 日本成人在线播放| 天天躁狠狠躁狠狠躁性色av| 国产精品偷伦视频免费观看了| 国产区卡一卡二卡三乱码免费| 免费高清日本中文| 亚洲人成人无码网www国产| 中文字幕无码日韩欧毛| 91老湿机福利免费体验| 韩国久播影院理论片不卡影院| 福利在线一区二区| 欧美69vivohd| 娇妻校花欲乱往事叶子txt下载| 国产精品日韩欧美一区二区三区| 国产午夜手机精彩视频| 内射白嫩少妇超碰| 亚洲www在线| xxxx日本视频| 欧美精品综合一区二区三区| 精品中文字幕一区二区三区四区| 欧美一级黄视频| 宅男噜噜噜66在线观看网站| 国产激情视频在线播放| 免费人成激情视频在线观看冫 | 国产夜趣福利免费视频| 偷拍激情视频一区二区三区| 久久精品aⅴ无码中文字字幕重口 久久精品aⅴ无码中文字字幕重口 | 壮汉紫黑粗大好深用力| 国产成人无码AV一区二区|