《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 字節豆包推出全新稀疏模型架構

字節豆包推出全新稀疏模型架構

推理成本最高可降83%
2025-02-13
來源:芯智訊

2月12日消息,字節跳動豆包大模型團隊近日宣布推出全新稀疏模型架構 UltraMem,解決了 MoE 推理的高額訪存問題,推理速度較 MoE 架構提升 2-6 倍,推理成本最高可降低 83%。

該研究揭示新架構的 Scaling Law,表明其不僅有出色的 Scaling 特性,性能還超越 MoE。實驗顯示,訓練規模達 2000 萬 value 的 UltraMem 模型,在同等計算資源下,能同時實現領先的推理速度和模型性能,為構建數十億規模 value 或 expert 開辟新途徑。

據悉,豆包大模型團隊的這項創新成果已被機器學習和AI領域的頂級會議ICLR 2025接收,為解決大模型推理效率和擴展能力問題提供了全新思路。

1.jpg

大模型的推理能力對應的是端側AI應用/工具的響應能力和速度。隨著模型規模的擴大,推理成本和訪存效率已成為限制大模型規模應用的關鍵瓶頸。

在Transformer架構下,模型的性能與其參數數量和計算復雜度呈對數關系。隨著LLM規模不斷增大,推理成本會急劇增加,速度變慢。

為了解決計算問題,先前的研究者提出了MoE和PKM(Product Key Memory)方案,但它們都有各自的局限性:

MoE架構犧牲了效率:MoE架構成功將計算和參數解耦,通過稀疏激活專家的方式,在訓練階段有效減少了計算量,但在推理時,由于模型在推理時只能一個字一個字的生成,batch size(批量大?。┖蛃equence length(序列長度)通常較小,少量的token即可激活幾乎所有的專家,進而導致訪存急劇上升,進而使推理延遲大幅增加。

PKM架構犧牲了效果:PKM架構通過引入“行路由”和“列路由”機制,這種方法讓每個token在推理時僅僅只激活極少數的value(與提示模板中的內容相關聯的數據或信息),所以推理時不會遇到訪存瓶頸,但其效果很差,且擴展能力有限,難以應對更大規模的模型需求。

這些局限性使得MoE和PKM在推理效率、模型效果和擴展能力等方面的優化空間仍需進一步探索。UltraMem正是為了解決上述痛點。

據介紹,UltraMem參考了PKM的設計,但針對PKM的缺陷予以補充,以實現更高效的訪存、更優質的檢索,同時,降低了顯存和部署成本,其優勢主要在于:

降低推理成本:與傳統的MoE架構相比,UltraMem在推理成本上實現了最高83%的降低,這對于大規模模型的部署和運行具有重要意義。

提升推理速度:UltraMem的推理速度相比MoE架構提升了2-6倍,這使得模型在處理大規模數據時更加高效。

保持模型效果:在降低推理成本和提升推理速度的同時,UltraMem還保持了模型的效果,確保了模型的準確性和可靠性。

豆包研究團隊在151M、680M、1.6B三個不同規模的模型上進行了廣泛的實驗。實驗結果表明,UltraMem在模型效果和推理速度方面均優于MoE和PKM架構,且在680M、1.6B上具有顯著的效果優勢。

2.jpg

無論是訓練端還是推理端,當大模型廠商卷起成本,意味著AI應用將在未來更加高效、易用。

推理成本大幅降低,將助推AI技術在更多領域的應用成為可能,尤其是對于資源受限的場景,如邊緣計算和移動設備等,能讓更多企業和開發者有能力使用和部署AI模型。

對于用戶而言,UltraMem架構的突破、推理速度的提升可使AI應用如智能助手、自然語言處理等在實時應用中響應更迅速,交互更流暢,優化用戶的使用體驗,提高內容創作、日常辦公等場景下的效率。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国语自产偷拍精品视频偷拍| 亚洲国产老鸭窝一区二区三区| 亚洲AV无码一区东京热| 香港特级三A毛片免费观看| 欧美三日本三级少妇三级久久| 国产在线精品观看一区| 三年片免费观看大全国语| 欧美黑人巨大xxxxx视频| 国产成人精品午夜福利| 中文字幕丰满孑伦| 波多野结衣电影thepemo| 国产成a人片在线观看视频下载| 丝袜诱惑中文字幕| 欧美最猛性xxxxx69交| 国产做床爱无遮挡免费视频| 一二三四社区在线视频社区| 欧美在线视频一区在线观看| 国产乱人免费视频| a视频在线观看免费| 最近中文字幕高清中文字幕电影二| 四虎成人免费网站在线| 91大神精品网站在线观看| 日韩免费视频网站| 农村老熟妇乱子伦视频| 美女网站在线观看视频免费的| 搡女人免费的视频| 亚洲日韩国产精品无码av| 视频一本大道香蕉久在线播放| 天堂在线ww小说| 久久男人av资源网站| 狠狠色香婷婷久久亚洲精品| 国产成人无码精品久久二区三区 | 国产精品亚洲精品青青青| 久久66热这里只会有精品| 波多野吉衣免费一区| 国产人妖ts丝丝magnet| a级毛片免费观看在线播放| 新婚熄与翁公老张林莹莹| 亚洲小视频在线观看| 肥臀熟女一区二区三区| 国产超薄肉色丝袜的免费网站|