基于强关系的用户属性信息推断方法
发布时间:2020-04-09 20:56
【摘要】:目前,互联网时代迅速发展,越来越多的用户开始进入新的社交时代-网络社交时代,使得在线社交网络得到高速的发展。微博、微信、QQ、人人网等社交平台相继出现并且逐渐拥有了大量的用户群体。用户在社交网络平台中填写自己的个人信息,其中包括用户性别、年龄、地域信息、兴趣爱好、家庭背景等属性信息,这些信息使得平台管理者和社交网络的研究者可以更好的开展研究管理工作。但是,在现阶段的用户属性信息中,往往存在着信息缺失或者虚假信息的现象,网络中用户资料的不完善,会影响到对社会网络的研究和平台的运营。研究者为了解决这一现象,提出了较为完善的用户未知属性信息推断方法,但是,目前效果较好且经典的信息推断方法没有在同一个大型真实社交网络数据平台上去验证比较推断效果,同时,所有的研究都是在无权网络上开展进行的,没有考虑到网络中节点之间权值的差异对用户未知属性信息推断的影响。本课题主要根据现阶段社交网络中存在的用户缺失信息问题,在同一大型社交网络数据集中分析及实验验证了现阶段经典用户属性信息推断方法的效果,并且首次提出了根据节点之间不同关系强度来对未知属性用户信息进行推断改进的思想,从本质上来看是利用节点之间的关系强度去除网络中噪声数据的过程。利用社会学中用户人际网络中强弱关系的知识,可以将原始的社交网络数据转换成标注了强弱边的加权联通数据网开展信息推断的研究工作。在推断实验中,我们也同时验证了节点之间的关系强度对于未知属性节点地域信息的推断会产生积极影响,同时,用户的强弱关系对于不同属性之间推断改进的效果有较为明显的差异。实验中验证了利用节点之间关系强度去除噪声数据可以更加高效率的对社交网络中虚假信息和缺失信息进行推断研究,强关系对于社交网络的用户、群体和网络本身都具有意义。我们需要合理的利用强关系,对于社交网络中的用户信息提供更好的研究手段和方法。
【图文】:
而对用户缺失属性进行更好的信息推断。本课题的研究内容具体包括:第一,研究在线社交网络关系强度的计算方法。将在线社会网络转换成标记了强关系的加权社会网络,同时测试用户属性信息推断的性能。其本质是一种数据分类的方式,利用不同的聚类方法将社交网络这一特殊的数据进行有特征的分类[27]。论文中会列举出几种有代表性且效果较好的分类方法,利用微博数据平台对几种分类算法进行测试。这里进行算法测试的数据集大小和规模是相同的,以便于将不同的算法进行横向的多指标对比,分析结果从而得出结论。第二,对社交网络中节点的未知属性信息进行推断,利用网络中的强关系去除噪声,改进现有的用户属性信息推断方法的性能,,对在线社交网络中缺失的用户属性信息进行增补和还原,以便对接下来的研究发现和探索创造方法提供研究思路。根据上述研究内容与整体架构,课题的研究思路如下图 1-1 所示:
59975 海外 4874 新疆 12922 湖南 375170 内蒙古 59145 江西 481708 海南 27753 香港 73093 福建 137988 云南 19718 吉林 211666 重庆 36156 青海 17133 西藏 39018 台湾 154651 澳门 30787应节点数如图 2-1 所示:
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09
本文编号:2621253
【图文】:
而对用户缺失属性进行更好的信息推断。本课题的研究内容具体包括:第一,研究在线社交网络关系强度的计算方法。将在线社会网络转换成标记了强关系的加权社会网络,同时测试用户属性信息推断的性能。其本质是一种数据分类的方式,利用不同的聚类方法将社交网络这一特殊的数据进行有特征的分类[27]。论文中会列举出几种有代表性且效果较好的分类方法,利用微博数据平台对几种分类算法进行测试。这里进行算法测试的数据集大小和规模是相同的,以便于将不同的算法进行横向的多指标对比,分析结果从而得出结论。第二,对社交网络中节点的未知属性信息进行推断,利用网络中的强关系去除噪声,改进现有的用户属性信息推断方法的性能,,对在线社交网络中缺失的用户属性信息进行增补和还原,以便对接下来的研究发现和探索创造方法提供研究思路。根据上述研究内容与整体架构,课题的研究思路如下图 1-1 所示:
59975 海外 4874 新疆 12922 湖南 375170 内蒙古 59145 江西 481708 海南 27753 香港 73093 福建 137988 云南 19718 吉林 211666 重庆 36156 青海 17133 西藏 39018 台湾 154651 澳门 30787应节点数如图 2-1 所示:
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP393.09
【参考文献】
相关期刊论文 前2条
1 沈洪洲;袁勤俭;;基于社交网络的社交关系强度分类研究[J];情报学报;2014年08期
2 张磊;陈贞翔;杨波;;社交网络用户的人格分析与预测[J];计算机学报;2014年08期
相关会议论文 前1条
1 赵云龙;李艳兵;;社交网络用户的人格预测与关系强度研究[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年
相关博士学位论文 前1条
1 万怀宇;社会网络中基于链接的分类问题研究[D];北京交通大学;2012年
相关硕士学位论文 前1条
1 吴玲玲;信息网络中节点缺失信息推断研究[D];北京邮电大学;2015年
本文编号:2621253
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2621253.html