數(shù)據(jù)中心最新文章

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識(shí)別方法

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過(guò)數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對(duì)信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過(guò)條件隨機(jī)場(chǎng)模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識(shí)別模型。針對(duì)脫敏工作需要,改變假陰性和假陽(yáng)性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評(píng)價(jià)模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗(yàn),F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識(shí)別,識(shí)別成功率高。現(xiàn)有評(píng)價(jià)指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評(píng)價(jià)體系。

發(fā)表于:9/25/2023

主站蜘蛛池模板: 四虎国产精品永久在线| 在线永久免费观看黄网站| 亚洲免费人成视频观看| 精品国产青草久久久久福利| 国产特级淫片免费看| caoporm超免费公开视频| 日本特黄特色aa大片免费| 亚洲成a人片在线不卡一二三区| 精品人妻系列无码人妻免费视频| 国产日产一区二区三区四区五区| 99热这里只有精品免费播放| 成人精品一区二区三区中文字幕| 亚洲av本道一区二区三区四区| 特级按摩一级毛片| 四虎影视免费永久在线观看| 精品丝袜国产自在线拍亚洲| 国模丽丽啪啪一区二区| 一级毛片黄色片| 日本理论片和搜子同居的日子演员| 亚洲图片小说网| 男人把j桶进女的屁股的动态| 国产三级电影在线播放| 亚洲国产最大av| 国语对白在线视频| 一本一道dvd在线观看免费视频| 日本道精品一区二区三区| 亚洲国产欧美日韩精品一区二区三区| 男人把女人桶爽30分钟应用| 四虎澳门永久8848在线影院| 黑人xxxx日本| 国产精品无码翘臀在线观看| a级毛片高清免费视频就| 成人免费视频网| 久久人人爽人人爽人人片dvd| 欧美亚洲综合另类| 亚洲第一综合天堂另类专| 粉嫩小仙女扒开双腿自慰| 国产AV日韩A∨亚洲AV电影| 鲁啊鲁在线视频免费播放| 国产精品一区91| 91chinesehomemadevideo|