《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 跨社交網絡的同一用戶識別算法
跨社交網絡的同一用戶識別算法
2022年電子技術應用第1期
沈佳琪1, 周國民2
1.浙江工業大學 信息工程學院,浙江 杭州310023;2.浙江警察學院 計算機與信息技術系,浙江 杭州310053
摘要: 針對跨社交網絡的同一用戶識別問題,提出了一種綜合用戶興趣、寫作風格和檔案屬性的識別方法。通過在這3種不同的特征維度下分別判定用戶關系,然后綜合判定結果,提高同一用戶識別準確性。其中,用戶興趣分為靜態興趣和動態興趣,靜態興趣采用TextRank算法從用戶背景信息中提取,動態興趣則利用主題模型從用戶發表的文本內容中挖掘出隨時間變化的興趣點。對于用戶寫作風格則通過One-Class SVM算法進行識別,最后利用信息熵賦權法比較用戶檔案屬性相似度。實驗結果表明,與傳統機器學習算法相比,所提算法精確率、召回率均有所提升。
中圖分類號: TN01;TP391
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.211518
中文引用格式: 沈佳琪,周國民. 跨社交網絡的同一用戶識別算法[J].電子技術應用,2022,48(1):109-114.
英文引用格式: Shen Jiaqi,Zhou Guomin. User alignment across social networks[J]. Application of Electronic Technique,2022,48(1):109-114.
User alignment across social networks
Shen Jiaqi1,Zhou Guomin2
1.College of Information Engineering,Zhejiang University of Technology,Hangzhou 310023,China; 2.Department of Computer and Information Security,Zhejiang Police College,Hangzhou 310053,China
Abstract: For the problem of identifying the same user across social networks, a recognition method that integrates user interests, writing style and profile attributes is proposed. By determining user relationships under these three different feature dimensions separately, and then synthesizing the results, the same user identification accuracy is improved. Among them, user interest is divided into static interest and dynamic interest, static interest is extracted from user background information by TextRank algorithm, while dynamic interest is mined from user published text content by using topic model to find out interest points that change over time. For user writing style, it is identified by One-Class SVM algorithm, and finally, the information entropy empowerment method is used to compare the similarity of user profile attributes. The experimental results show that the proposed algorithm has improved accuracy and recall rate compared with traditional machine learning algorithms.
Key words : across social networks;users identification;user interest;writing style;file attribute

0 引言

    近年來,個人信息數據隨社交網絡的普及變得越來越豐富,目前對社交網絡的用戶分析主要針對單一平臺,但由于單一平臺數據存在局限性[1],因此可通過挖掘同一用戶在不同社交網絡中的多個賬號,為社交網絡分析提供數據支撐[2]

    基于用戶檔案屬性的識別方式是研究最廣的方法。Zafarani等[3]通過比較用戶選取用戶名的行為特征相似度判斷是否為同一用戶;Zhang等[4]結合用戶名、頭像等多個屬性,利用樸素貝葉斯進行識別。然而上述研究中的特征容易缺失和偽造[5]。因此,一些研究從發表的文本內容入手,挖掘用戶興趣,比較興趣相似度來判定用戶關系[6]。何力等[7]采用LDA模型來挖掘文本內容中的用戶興趣;呂志泉等[8]在LDA模型的基礎上引入了時間因子。但上述研究僅考慮了文本內容體現的動態興趣,沒有結合靜態興趣,同時,即使是同一用戶,在不同社交平臺關注和發表的內容也可能有較大差別,這影響了用戶識別效果。




本文詳細內容請下載:http://m.xxav2194.com/resource/share/2000003919




作者信息:

沈佳琪1, 周國民2

(1.浙江工業大學 信息工程學院,浙江 杭州310023;2.浙江警察學院 計算機與信息技術系,浙江 杭州310053)




wd.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 三年片在线观看免费观看大全中国 | 在线播放国产一区二区三区| 久久精品影院永久网址| 用被子自w到高c方法| 国产嫩草影院在线观看| 91色综合久久| 岳在我胯下哭泣| 久久国产精品-国产精品| 欧美日韩国产手机在线观看视频| 杨贵妃艳史毛片在线播放免费观看| 同桌一直在夹腿还嗯啊的叫| 欧美老少配xxxxx| 国美女福利视频午夜精品| 中文字幕一区二区三区日韩精品| 未满小14洗澡无码视频网站| 亚洲精品短视频| 美国人与动性xxx杂交视频| 国产女人和拘做受视频免费| 2022国产麻豆剧果冻传媒剧情 | 亚洲中文字幕无码专区| 焰灵姬下面夹得好紧| 啊老师太深了好大| 高清欧美一区二区三区| 国产精品无码素人福利不卡 | 欧美精品九九99久久在免费线| 午夜久久久久久久| 青娱乐欧美视频| 国产真实伦实例| 7777精品久久久大香线蕉| 奇米影视888欧美在线观看| 久久91精品国产91久久| 日韩精品亚洲一级在线观看| 亚洲日韩精品欧美一区二区| 男女生差差差很痛的app| 啪啪网站永久免费看| 里番肉片h排行榜| 国产日产欧产精品精品电影| 18美女腿打开无遮挡| 在车上狠狠的吸她的奶| 一区二区三区四区无限乱码| 成年1314在线观看|