当前位置:主页 > 科技论文 > 自动化论文 >

基于双层采样主动学习的社交网络虚假用户检测方法

发布时间:2018-04-17 17:29

  本文选题:社交网络 + 虚假用户 ; 参考:《自动化学报》2017年03期


【摘要】:社交网络的飞速发展给用户带来了便捷,但是社交网络开放性的特点使得其容易受到虚假用户的影响.虚假用户借用社交网络传播虚假信息达到自身的目的,这种行为严重影响着社交网络的安全性和稳定性.目前社交网络虚假用户的检测方法主要通过用户的行为、文本和网络关系等特征对用户进行分类,由于人工标注用户数据需要的代价较大,导致分类器能够使用的标签样本不足.为解决此问题,本文提出一种基于双层采样主动学习的社交网络虚假用户检测方法,该方法使用样本不确定性、代表性和多样性3个指标评估未标记样本的价值,并使用排序和聚类相结合的双层采样算法对未标记样本进行筛选,选出最有价值的样本给专家标注,用于对分类模型的训练.在Twitter、Apontador和Youtube数据集上的实验说明本文所提方法在标签样本数量不足的情况下,只使用少量有标签样本就可以达到与有监督学习接近的检测效果;并且,对比其他主动学习方法,本文方法具有更高的准确率和召回率,需要的标签样本数量更少.
[Abstract]:The rapid development of social networks brings convenience to users, but the openness of social networks makes them vulnerable to the influence of false users.False users use social networks to spread false information for their own purposes, which seriously affects the security and stability of social networks.At present, the detection methods of false users in social networks mainly classify users by their behavior, text and network relationship, because of the high cost of manually tagging user data.As a result, the classifier can use insufficient sample labels.In order to solve this problem, this paper proposes a double-layer sampling active learning based method for detecting false users in social networks. The method uses three indexes: sample uncertainty, representativeness and diversity to evaluate the value of unlabeled samples.The double-layer sampling algorithm combined with sorting and clustering is used to screen unlabeled samples, and the most valuable samples are selected for expert tagging, which is used to train the classification model.Experiments on the Twitter Apontador and Youtube datasets show that the method proposed in this paper can achieve a detection effect close to that of supervised learning by using only a small number of tagged samples when the number of tag samples is insufficient, and compared with other active learning methods.The proposed method has higher accuracy and recall rate and requires fewer tag samples.
【作者单位】: 信息物理社会可信服务计算教育部重点实验室;重庆大学软件学院;悉尼科技大学工程与信息技术学院量子计算与智能系统研究中心;广州博冠信息科技有限公司;
【基金】:国家重点基础研究发展计划(973计划)(2013CB328903) 重庆市基础与前沿研究计划(cstc2015jcyj A40049) 国家自然科学基金(71102065) 国家科技支撑计划(2015BAF05B03) 中央高校基础研究基金(106112014CDJZR095502)资助~~
【分类号】:TP393.09;TP181

【相似文献】

相关期刊论文 前10条

1 ;基于位置的手机社交网络“贝多”正式发布[J];中国新通信;2008年06期

2 曹增辉;;社交网络更偏向于用户工具[J];信息网络;2009年11期

3 ;美国:印刷企业青睐社交网络营销新方式[J];中国包装工业;2010年Z1期

4 李智惠;柳承烨;;韩国移动社交网络服务的类型分析与促进方案[J];现代传播(中国传媒大学学报);2010年08期

5 贾富;;改变一切的社交网络[J];互联网天地;2011年04期

6 谭拯;;社交网络:连接与发现[J];广东通信技术;2011年07期

7 陈一舟;;社交网络的发展趋势[J];传媒;2011年12期

8 殷乐;;全球社交网络新态势及文化影响[J];新闻与写作;2012年01期

9 许丽;;社交网络:孤独年代的集体狂欢[J];上海信息化;2012年09期

10 李玲丽;吴新年;;科研社交网络的发展现状及趋势分析[J];图书馆学研究;2013年01期

相关会议论文 前10条

1 赵云龙;李艳兵;;社交网络用户的人格预测与关系强度研究[A];第七届(2012)中国管理学年会商务智能分会场论文集(选编)[C];2012年

2 宫广宇;李开军;;对社交网络中信息传播的分析和思考——以人人网为例[A];首届华中地区新闻与传播学科研究生学术论坛获奖论文[C];2010年

3 杨子鹏;乔丽娟;王梦思;杨雪迎;孟子冰;张禹;;社交网络与大学生焦虑缓解[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

4 毕雪梅;;体育虚拟社区中的体育社交网络解析[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年

5 杜p,

本文编号:1764556


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/1764556.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7997f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com