基于图聚类的虚假评论人群组检测算法研究
发布时间:2018-02-26 01:35
本文关键词: 图聚类 最小割 双连通 虚假评论人群组检测 出处:《沈阳理工大学》2016年硕士论文 论文类型:学位论文
【摘要】:随着互联网技术的不断发展,互联网已经融入了我们生活中的方方面面。评论系统是以此为背景发展起来的一个新兴产物,其广泛应用于各大社交网站,电子商务平台,以及论坛,贴吧等互联网应用中。尤其在电子商务领域,由于网络的虚拟性以及用户对所购买的产品无法直观的去感受等原因,评论系统中其他用户对于产品的评论是其他顾客在选购产品时重要的参考依据。很多不良商家出于个人利益的原因,雇佣虚假评论人对其销售的产品进行夸大性的评论,或者雇佣虚假评论人对其竞争对手进行诋毁性的评论。虚假评论问题的出现,大大推进了针对此方面的研究。国内外诸多研究人员针对此问题从不同角度,采用不同方法对此问题进行了诸多研究。本文针对此问题提出了一个基于图聚类思想的虚假评论人群组检测算法。本文认为仅从单个评论人的角度来发现虚假评论人其准确性以及效率是相当低的。只要虚假评论人在其评论过程中刻意模仿正常评论人的行为或者进行群组的虚假评论,则此类评论人则不易发现。本文提出的算法善于发现隐藏较深的虚假评论人和合作倾向的虚假评论人群组。本文针对评论人之间的相似度提出了从属性和结构两方面考虑的相似度计算公式,并且认为真正的虚假评论人群组应该是组内联系紧密的一个小团体,故在虚假评论人群组建立的时候利用双连通技术对其组内紧密度进行了严格的约束。在后续聚类阶段采用模糊图分割技术,针对图分割技术在图聚类中的诸多问题结合我们的应用场景对其进行了解决。在最终的实验环节,本文针对虚假评论人群组检测的特性,提出了若干针对虚假评论人群组的人工评估特征,并利用这些特征对算法中的结果进行了人工的检验。同时在相同数据集下从本文算法计算出的结果中抽取500个虚假评论人群组与其他算法计算出的500名虚假评论人群组进行准确率方面的比较,进而验证我们算法在准确率方面的优势。
[Abstract]:With the development of Internet technology , the Internet has been integrated into all aspects of our life . The comment system is a new product developed in this paper . It is widely used in Internet applications such as social networking sites , e - commerce platforms , forums , and so on .
【学位授予单位】:沈阳理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 王哲;常发亮;;基于网络最小割的分层立体视觉匹配方法[J];模式识别与人工智能;2007年01期
2 彭启民,贾云得;一种基于最小割的稠密视差图恢复算法[J];软件学报;2005年06期
3 何瑞春;张忠辅;段刚;;网络割的计数[J];大学数学;2007年06期
4 谭向东,童家榕,,唐璞山;用于VLSI线网的多重优化的最小割划分算法[J];计算机学报;1996年05期
5 周强锋;田铮;刘丙涛;;基于参数化最小割方法的SAR图像区域分割[J];工程数学学报;2010年05期
6 徐光联;邢永中;;网络分析中应用最大流最小割的初值[J];通信技术;2008年09期
7 张少娟;邹建成;;图割综述[J];北方工业大学学报;2010年03期
8 刘伊生;;网络计划最低费用日程的一种新解法[J];北方交通大学学报;1993年01期
9 戴连贵,丁月华;离散事件动态系统的分层最优监控[J];控制与决策;1999年04期
10 吴金宇;金舒原;杨智;;基于网络流的攻击图分析方法[J];计算机研究与发展;2011年08期
相关硕士学位论文 前1条
1 宋大为;基于图聚类的虚假评论人群组检测算法研究[D];沈阳理工大学;2016年
本文编号:1536021
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1536021.html