基于預訓練模型的基層治理敏感實體識別方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>3658 K
標簽: 預訓練語言模型 基層治理 中文命名實體識別
所需積分:0分積分不夠怎么辦?
文檔介紹:基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進行數(shù)據(jù)脫敏。因此,需要對非結(jié)構(gòu)化文本數(shù)據(jù)進行命名實體識別以提取敏感數(shù)據(jù)。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機場模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進行實驗,F(xiàn)1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結(jié)構(gòu)化文本的敏感實體識別,識別成功率高?,F(xiàn)有評價指標未能較好地反映敏感實體的間接推理關(guān)系,應當探索更完善的敏感實體評價體系。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 日日天干夜夜人人添| 免费观看国产小粉嫩喷水| 久久久久久一区国产精品| 91制片厂在线播放| 欧美一级高清片免费一级| 夫妇交换性3中文字幕| 亚洲欧美日韩中文无线码| 久久综合九色综合欧美就去吻| 日本三级在线观看免费| 免费在线视频你懂的| 伊人影视在线观看日韩区| 日本精品久久久久中文字幕8 | 久久精品国产亚洲7777| 羞羞视频免费观看| 夜夜偷天天爽夜夜爱| 亚洲AV成人无码网站| 老师你的兔子好软水好多作文高清| 在线精品国产一区二区三区| 亚洲AV香蕉一区区二区三区| 美国式禁忌5太大了| 国内不卡一二三四区| 久久精品人人槡人妻人人玩| 欧美黑人xxxx| 国产又大又粗又猛又爽的视频 | 欧美色欧美亚洲高清在线观看| 噜噜噜噜私人影院| 6080新觉伦| 故意打开双腿让翁公看| 亚洲色欲www综合网| 国产91精品在线| 成人au免费视频影院| 亚洲欧洲在线播放| 调教视频在线观看| 夜夜精品视频一区二区| 久久96精品国产| 欧美日韩精品一区二区三区不卡 | 法国性经典xxxxhd| 国产又污又爽又色的网站| 337p日本欧洲亚洲大胆色噜噜| 扒开双腿疯狂进出爽爽动态图 | 国产精品乱码一区二区三区|