《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 阿里巴巴開源1100億參數Qwen1.5-110B 模型

阿里巴巴開源1100億參數Qwen1.5-110B 模型

2024-04-28
來源:IT之家

阿里巴巴日前宣布,開源 Qwen1.5 系列首個千億參數模型 Qwen1.5-110B,該模型在基礎能力評估中與 Meta-Llama3-70B 相媲美,在 Chat 評估中表現出色,包括 MT-Bench 和 AlpacaEval 2.0。

匯總主要內容:

據介紹,Qwen1.5-110B 與其他 Qwen1.5 模型相似,采用了相同的 Transformer 解碼器架構。它包含了分組查詢注意力(GQA),在模型推理時更加高效。該模型支持 32K tokens 的上下文長度,同時它仍然是多語言的,支持英、中、法、西、德、俄、日、韓、越、阿等多種語言。

阿里 Qwen1.5-110B 模型與最近的 SOTA 語言模型 Meta-Llama3-70B 以及 Mixtral-8x22B 進行了比較,結果如下:

1.jpg

上述結果顯示,新的 110B 模型在基礎能力方面至少與 Llama-3-70B 模型相媲美。在這個模型中,阿里巴巴沒有對預訓練的方法進行大幅改變,因此他們認為與 72B 相比的性能提升主要來自于增加模型規模。

阿里還在 MT-Bench 和 AlpacaEval 2.0 上進行了 Chat 評估,結果如下:

2.jpg

阿里巴巴表示,與之前發布的 72B 模型相比,在兩個 Chat 模型的基準評估中,110B 表現顯著更好。評估結果的持續改善表明,即使在沒有大幅改變后訓練方法的情況下,更強大、更大規模的基礎語言模型也可以帶來更好的 Chat 模型。

最后,阿里方面表示,Qwen1.5-110B 是 Qwen1.5 系列中規模最大的模型,也是該系列中首個擁有超過 1000 億參數的模型。它在與最近發布的 SOTA 模型 Llama-3-70B 的性能上表現出色,并且明顯優于 72B 模型。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 91香蕉视频黄| 大陆一级毛片免费视频观看i| 无码精品一区二区三区在线 | 免费欧洲美女牲交视频| 亚洲自偷自偷在线制服| 亚洲AV无码AV制服另类专区| 丰满妇女强制高潮18XXXX| v片免费在线观看| 久热中文字幕在线精品免费 | 国产精品亚洲二区在线| 国产va免费精品高清在线观看| 免费中文字幕在线| 亚洲一区二区三区在线观看网站| 中文字幕在线观看日韩| 91福利在线视频| 视频免费在线观看| 波多野结衣四虎| 日本成人免费在线视频| 在线中文字幕网| 国产亚洲人成a在线v网站| 亚洲综合图片小说区热久久| 久久国产劲暴∨内射新川| 99免费视频观看| 要灬要灬再深点受不了好舒服| 波多野结衣导航| 成年女人午夜毛片免费看| 国产精品欧美视频另类专区| 国产gav成人免费播放视频| 亚洲成a人片在线不卡一二三区| 中文字幕影片免费在线观看 | 中文字幕日韩欧美一区二区三区| 2021果冻传媒剧情在线观看| 美美女高清毛片视频免费观看 | 美女主动张腿让男人桶| 末成年女av片一区二区| 天天干天天干天天干天天干天天干| 国产大片b站免费观看直播| 亚洲男人的天堂在线播放| 中国一级特黄的片子免费| 黑人一级大毛片| 欧美日韩精品视频一区二区|