《電子技術(shù)應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 中國信通院啟動AI大模型幻覺評測

中國信通院啟動AI大模型幻覺評測

總體涉及五種測試維度
2025-03-20
來源:IT之家
關(guān)鍵詞: 中國信通院 AI 大模型幻覺

3 月 19 日消息,IT之家從中國信通院官方微信公眾號獲悉,為摸清大模型的幻覺現(xiàn)狀,推動大模型應用走深走實,中國信息通信研究院人工智能所基于前期的 AI Safety Benchmark 測評工作,發(fā)起大模型幻覺測試。

大模型幻覺(AI Hallucination)是指模型在生成內(nèi)容或回答問題時,產(chǎn)生了看似合理,實則與用戶輸入不一致(忠實性幻覺)或者不符合事實(事實性幻覺)的內(nèi)容。隨著大模型在醫(yī)療、金融等關(guān)鍵領(lǐng)域廣泛應用,大模型幻覺帶來的潛在應用風險日益加劇,正得到業(yè)界的廣泛關(guān)注。

本輪幻覺測試工作將以大語言模型為測試對象,涵蓋了事實性幻覺和忠實性幻覺兩種幻覺類型,具體測評體系如下:

00.jpg

測試數(shù)據(jù)包含 7000 余條中文測試樣本,測試形式包括對應于忠實性幻覺檢測的信息抽取與知識推理兩類題型,以及對應事實性幻覺檢測的事實判別題型。總體涉及人文科學、社會科學、自然科學、應用科學和形式科學五種測試維度。

00.jpg

中國信通院邀請各相關(guān)企業(yè)參與模型測評,共同推動大模型安全應用。


Magazine.Subscription.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 热久久中文字幕| 18禁无遮挡羞羞污污污污免费| 欧美五级在线观看视频播放| 四虎在线视频免费观看| 香蕉视频成人在线观看| 日本按摩高潮a级中文片| 亚洲日韩乱码中文无码蜜桃臀 | 无码国产69精品久久久久孕妇| 亚洲日韩在线中文字幕综合| 精品大臿蕉视频在线观看| 国产日产卡一卡二乱码| 99久久免费看国产精品| 成人毛片18女人毛片免费| 亚州一级毛片在线| 毛片免费观看的视频在线| 又粗又硬又爽的三级视频| 麻豆精品国产免费观看| 国产麻豆一精品一aV一免费| 中文国产成人精品久久不卡| 中文字幕中文字字幕码一二区| 男人天堂网在线观看| 国产三级在线免费| 性xxxxbbbb| 天天操夜夜操天天操| 久久久久亚洲av无码尤物| 最近最新中文字幕高清中文字幕网| 亚洲精品国产精品乱码不99| 精品国产粉嫩内射白浆内射双马尾| 国产在线视频不卡| 手机看片日韩福利| 在线免费看黄网站| www好男人精品视频在线观看| 我要看a级毛片| 久久精品免费一区二区喷潮| 欧美在线观看第一页| 免费一级片在线| 股间白浊失禁跪趴老师| 国产精品VIDEOSSEX久久发布| 一个人看的www高清直播在线观看| 日韩精品人妻系列无码av东京| 亚洲永久中文字幕在线|