8 月 21 日消息,深度求索官方今日正式對外發(fā)布 DeepSeek-V3.1,官方提到 DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的參數(shù)精度。
在 DeepSeek 官方公眾號文章頁面,DeepSeek 進(jìn)一步解釋稱,UE8M0 FP8 是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)。
注:FP 英文全稱為 Floating Point,是 IEEE 定義的標(biāo)準(zhǔn)浮點(diǎn)數(shù)類型。UE8M0 FP8 在 AI 模型領(lǐng)域代表一種模型精度。
DeepSeek V3.1 的 Base 模型在 V3 的基礎(chǔ)上重新做了外擴(kuò)訓(xùn)練,一共增加訓(xùn)練了 840B tokens。Base 模型與后訓(xùn)練模型均已在 Huggingface 與魔搭開源。
附開源地址:
Base 模型:
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base
后訓(xùn)練模型:
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-V3.1
魔搭:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。