当前位置:主页 > 科技论文 > 软件论文 >

社交媒体用户识别方法研究

发布时间:2021-01-02 20:00
  伴随着移动网络技术的发展,社交媒体用户数量迎来了爆炸式增长,社交媒体已然成为存储用户信息的庞大数据库。社交媒体用户识别是指对用户的账号信息、属性信息、心理状况和行为习惯等相关内容进行识别。出于不同的社交目的,同一用户通常会在不同的社交应用中注册多个账号,并且有可能提供不同的身份信息。通过社交媒体用户识别技术匹配不同平台的用户账号,构建全面的用户信息库,从而为商品推荐、信息检索和网络空间监管等下游应用提供有效支撑。同时出于保护个人隐私的考虑,用户往往会选择隐藏个人信息,这导致用户某些有价值的属性信息难以直接获取。通过社交媒体用户识别技术对用户缺失的属性信息进行推测,能够进一步完善用户信息库,从而更加全面地了解用户。本文针对社交媒体用户识别问题,从跨社交媒体的用户账号匹配和社交媒体用户属性识别两方面开展研究,主要贡献包括如下两方面内容:(1)提出了一种基于维特比算法的社交媒体账号匹配方法。传统的账号匹配方法存在着匹配效率低下和多平台账号匹配准确率低的问题。本论文通过以下三个步骤解决了传统方法存在的问题。首先,该方法基于账号用户名相似性构建候选匹配账号集合,通过缩小候选匹配账号集合的大小解决... 

【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校

【文章页数】:73 页

【学位级别】:硕士

【部分图文】:

社交媒体用户识别方法研究


图卷积网络算法框架图

示意图,地理位置,示意图,边界框


电子科技大学硕士学位论文24上述三种情况的公式化定义如(3-11)所示。1212212112122Bbox()/Bbox()ifBbox()Bbox()Bbox()/Bbox()ifBbox()Bbox()score1/(1)if,0.0locllllllllllll=+在一个国家其它(3-11)根据上述公式,假如,1l=“NewYork”,2l=“Manhattan”,由于Manhattan是NewYork的一个行政区,NewYork的边界框覆盖了Manhattan区域,则这两个地理位置的相似度值为两个区域的面积的比值。假如,1l=“Athens”,2l=“Logan”,如图3-5所示,两个地理位置属于同一个国家,但两个地理位置的边界框不重合则使用边界框中心的欧几里得距离进行计算,其中122ll表示两个边界框中心的的欧几里得距离。图3-5地理位置示意图(3)教育工作信息教育工作信息由用户就职的公司和受教育的学校组成。Linkedin是一个专业的职场社交网站,用户通常会选择公开其教育和工作经历,Facebook网站的个人信息页也要求用户填写教育和工作经历,虽然Twitter的个人信息页面不包含教育和工作经历,但用户经常会在其推文中提及(@)其公司和学校,我们可以从推文中提取@信息作为工作和教育信息的来源。因此可以通过上述方式获得用户在不同社交平台上的教育工作信息集合,例如,用户PeterMullen对应的三个集合为SetL={CNNInternational,CNN,BBC,NewYorkTimes,UniversityofColumbia},SetF

用户信息,网站,页面,账号


第三章基于维特比算法的社交媒体账号匹配29维特比算法是一种动态规划算法,通过记录中间状态的最短路经对匹配路径不断进行剪枝大大降低了在匹配网络中寻找最短路的时间复杂度,使用维特比算法进行求解的时间复杂度为()2KN,其时间复杂度与K呈线性关系。综上所述,基于维特比算法的社交媒体账号匹配方法的整体时间复杂度为()2KN。在实际应用中,本论文方法通过使用维特比算法极大地降低了多平台账号匹配的时间复杂度,同时可以通过设定D和p的大小来控制N值的大小将本论文算法的时间消耗控制在可以接受的范围。3.6实验评估3.6.1实验数据和评估指标为了验证基于维特比算法的社交媒体账号匹配方法的有效性,需要对一批具有真实匹配关系的账号进行测试。目前通常使用众包平台和问卷调查的方式获得具有真实匹配关系的社交账号,但是使用这两种方式获得可靠匹配账号的难度较大。经过调研发现很多网站提供个人联系信息汇总服务,如图3-8所示,Rocketreach是一个联系信息汇总网站,用户在该网站上注册账号时需要提供指向其他社交平台的个人主页链接,从该网站的用户信息页面能够获得该用户在不同平台的社交账号。因此本论文从Rocketreach网站上收集匹配账号构建测试数据集。图3-8RocketSearch网站用户信息页面本论文一共在RocketSearch网站收集了6427个社交账号,这些社交账号来自于Facebook,Twitter,Linkedin,Github,Quora和Instagram等社交平台,不同社交平台账号占比统计数据如表3-8所示。

【参考文献】:
期刊论文
[1]基于信息熵的跨社交网络用户身份识别方法[J]. 吴铮,于洪涛,刘树新,朱宇航.  计算机应用. 2017(08)
[2]基于用户名特征的用户身份同一性判定方法[J]. 刘东,吴泉源,韩伟红,周斌.  计算机学报. 2015(10)
[3]基于多属性决策的社交网络用户识别(英文)[J]. 叶娜,张银亮,董丽丽,边根庆,Enjie LIU,Gordon J.Clapworthy.  中国通信. 2013(12)



本文编号:2953544

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2953544.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4cd16***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com