數(shù)據(jù)中心最新文章

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識(shí)別方法

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對(duì)信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機(jī)場(chǎng)模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識(shí)別模型。針對(duì)脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評(píng)價(jià)模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗(yàn),F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識(shí)別,識(shí)別成功率高。現(xiàn)有評(píng)價(jià)指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評(píng)價(jià)體系。

發(fā)表于:9/25/2023

主站蜘蛛池模板: 日本视频一区在线观看免费| 精品少妇ay一区二区三区| 特级做a爰片毛片免费看| 国产女人的一级毛片视频| av在线亚洲欧洲日产一区二区| 日韩一区二区三区精品| 亚洲欧美国产va在线播放| 精品少妇人妻av无码久久| 国产尹人香蕉综合在线电影| 97av麻豆蜜桃一区二区| 性色生活片在线观看| 久久综合网欧美色妞网| 欧美香蕉爽爽人人爽| 内射在线Chinese| 蝌蚪蚪窝视频在线视频手机| 国产精品剧情原创麻豆国产| hdjapanhdsexxx| 护士又湿又紧我要进去了| 久久青草精品38国产| 欧美特黄三级电影aaa免费| 冻千秋的堕落h污文冬妃| 露暴的楠楠健身房单车| 国产福利不卡视频| 91青青国产在线观看免费| 巨大破瓜肉h强| 久久99精品久久久久久久久久 | 一级片免费试看| 日韩一区二区在线视频| 亚洲五月激情网| 毛片网站免费在线观看| 免费无遮挡无码视频在线观看| 草莓视频app在线播放| 国产成人爱片免费观看视频| 80s国产成年女人毛片| 天天操天天干天天摸| 两个人看的www视频免费完整版 | 精品亚洲国产成人| 国产一区二区三区亚洲综合 | 国产在线一区二区三区av| 香蕉视频在线观看男女| 天堂中文在线资源|