当前位置:主页 > 管理论文 > 移动网络论文 >

跨社交网络用户身份识别算法研究

发布时间:2020-07-09 20:40
【摘要】:近年来,各种社交网络如雨后春笋般应运而生,如微博、豆瓣、知乎等,并逐渐成为人们生活中不可或缺的组成部分。跨社交网络用户身份识别算法研究作为在线社交网络研究的重要组成部分,在网络空间安全、个性化服务推荐和社交网络数据挖掘等领域具有重要的意义。目前,跨社交网络用户身份识别算法研究已经取得相当大的进展,各种身份识别算法相继被提出,但是相关研究中仍然存在标签的非一致性、匹配结果的不稳定性和档案特征提取的片面性等问题。本文针对这些问题提出两种用户身份识别算法。首先,为了解决标签非一致性问题,提出了一种基于用户标签语义相似性的用户身份识别算法。首先,该算法使用用户名相似度作为标准来挑选候选匹配账号;其次,使用基于标签语义的相似度计算两个账号标签之间的相似度特征,并针对标签缺失的情况使用主题生成模型从用户发布的文本信息中提取主题关键字作为用户标签;最后,该算法通过计算两个账户的标签相似度是否大于某个阈值来确定两个账户的匹配。与传统基于标签的用户身份识别算法的对比实验表明,平均倒数排名提高了 15%,准确率、精确率、召回率和Fl-score分别提高了 22%、15.7%、24%和20.5%。其次,为了解决匹配结果的不稳定性和档案特征提取的片面性,提出了一种基于稳定婚姻匹配的用户身份识别算法。首先,使用用户名和好友链接结合的方式选择候选账号;其次,对用户档案的属性项提取字符、语义以及属性间的相似性特征;最后,使用双向匹配算法实现账号的匹配。与前人提出相关算法的对比实验表明,在精确率、召回率和F1-score分别提高了2%、28%和18.8%。最后,本文对跨社交网络用户身份识别算法做了总结,分析了文中提出的跨社交网络见户身份识别算法的优缺点,并对该领域的发展方向进行了展望。
【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.3
【图文】:

网络图,社交


拥有5.54个账号,并长期经常使用的账号数为2.82个。在大数据时代,人们现在普遍认逡逑识到打通数据间的“孤岛”,实现数据的融合,从而提高工作效率和服务质量,产生更加逡逑巨大的财富和价值。如图1.1所示,识别出互联网用户在不同社交网络中的多重身份,在逡逑不同的社交网站之间建立起孤岛之间的“桥梁”,就可以将孤立在各个社交网络中的“数逡逑据碎片”链接起来,实现多个社交网络的融合,从而更大限度的收集用户信息,对用户逡逑海量社交网络数据进行充分挖掘,构建出用户完整的社交网络图。逡逑凡逡逑力口逦,李一李一^赵'逦白逡逑燕逦\严逦严Z逦陆逡逑图1.1跨社交网络用户身份识别举例逡逑1.1.2研究意义逡逑(1)网络空间治安管理逡逑随着互联网技术的飞速发展,社交网络充斥着各种危险,人们对于网络空间安全越逡逑来越重视[51。在社交网络平台上除了正常的用户之外,一些不法分子也会潜伏在这些社逡逑交网络平台上。一些非法分子同时在不同的社交网络中注册多个身份账号,针对各种社逡逑交网站提供的各类行为接口

示意图,社交,节点,用户身份


定义2.4跨社交网络连接.用■,吻表示社交网络N现械挠没矸菡撕佩义希ズ蜕缃煌纾牵仓械挠没矸荩ナ粲谙呦峦桓鲇没В校牵В舰牛辏玻澹垮澹垮澹浚硎究珏义仙缃煌缌蛹稀8荻ㄒ澹美嗔庸叵稻哂卸猿菩裕缤迹玻彼尽e义希瑰义

本文编号:2747953

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2747953.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户04da9***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com