基于梯度優(yōu)化的大語言模型后門識(shí)別探究
所屬分類:技術(shù)論文
上傳者:wwei
文檔大小:1222 K
標(biāo)簽: 大語言模型 后門攻擊 基于梯度的后門識(shí)別
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著大語言模型的流行并且應(yīng)用在越來越多的領(lǐng)域,大語言模型的安全問題也隨之而來。 通常訓(xùn)練大語言模型對(duì)數(shù)據(jù)集以及計(jì)算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網(wǎng)絡(luò)上開源的數(shù)據(jù)集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數(shù)據(jù)時(shí)模型表現(xiàn)像沒有注入后門時(shí)一樣正常,但當(dāng)輸入帶有后門觸發(fā)器的數(shù)據(jù)時(shí)模型輸出異常。防止后門攻擊的有效方法就是進(jìn)行后門識(shí)別。目前基于梯度的優(yōu)化方法是比較常用的,但使用這些方法時(shí)內(nèi)部影響因子的設(shè)定對(duì)識(shí)別效果具有一定影響。文章就詞令牌數(shù)量、最鄰近數(shù)量、噪聲大小進(jìn)行了實(shí)驗(yàn)測(cè)量和作用機(jī)制的分析,以便為后續(xù)使用這些方法的研究者提供參考。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 亚洲国产精品成人久久久| 日韩在线看片免费人成视频播放 | 翁与小莹浴室欢爱51章| 国产精品俺来也在线观看| 久9久9精品视频在线观看| 久青草久青草视频在线观看| 伊人久久大香线蕉电影院| 动漫精品动漫一区三区3d| 午夜高清啪啪免费观看完整| 国产日韩欧美综合| 国产成人vr精品a视频| 国产一级片在线播放| 国产午夜精品一区二区| 国产卡一卡二卡三卡四| 公交车老师屁股迎合我摩擦| 国产精品欧美福利久久| 亚洲欧美日韩久久精品第一区| 2022国产成人精品福利网站| 成人免费视频观看无遮挡| 亚洲精品在线播放| 老子午夜精品无码| 国产熟女一区二区三区五月婷| 99热这里有免费国产精品| 成人国产在线不卡视频| 久久精品成人一区二区三区| 精品人妻系列无码一区二区三区 | 亚洲国产欧美日韩| 精品91一区二区三区| 国产亚洲精久久久久久无码77777| 无遮挡1000部拍拍拍免费凤凰| 天堂影院www陈冠希张柏芝| 久久青草国产免费观看| 欧美日韩在线视频专区免费| 免费极品av一视觉盛宴| 黄色a级片免费看| 国产精品电影网| a毛片在线免费观看| 日本护士xxx| 伊人色综合网一区二区三区| 草草影院ccyy国产日本欧美| 女m羞辱调教视频网站|