基于SVM的新浪微博营销类水帖识别研究
发布时间:2017-12-27 00:11
本文关键词:基于SVM的新浪微博营销类水帖识别研究 出处:《湘潭大学自然科学学报》2015年04期 论文类型:期刊论文
【摘要】:研究一种发现水帖的分类算法.该方法利用SimHash方法将发帖重复当成类似网页去重的问题处理,发帖内容的重复度和其他特征,如发帖的密集型、帐号名称的相似性,所使用的客户端等特征将用于水帖与正常发帖的分类.该文利用新浪微博API下载多个汽车营销账号下的交互数据作为实验数据,并使用SVM作为分类器.实验结果表明,该方法能够较好地发现那些伪装性非常好的水军所发布的水帖.
[Abstract]:A study found that water post classification algorithm. The method using the SimHash method to repeat posting as similar pages to weight problems, post content repeatability and other characteristics, such as similarity, intensive post account name, the client will use such characteristics in water and normal post post classification the use of sina. Micro-blog API download multiple car marketing account under the interactive data as the experimental data, and use SVM as the classifier. The experimental results show that this method can effectively find those issued by the camouflage very good the water posts.
【作者单位】: 常州大学信息科学与工程学院;
【基金】:国家自然科学基金项目(61272367)
【分类号】:TP393.092;TP391.1
【正文快照】: 水军发现是这些年来微博研究中一个热门课题[1].[2]提出一种用评论自身文本属性进行虚假评论的识别.除此以外,Sun[3]还使用了用户等特征.但是这些模型对微博营销账号效果不佳,因为这些水军账号与正常用户在统计上的差别不大.高度隐蔽性导致从用户角度考察变得十分困难.如果换,
本文编号:1339431
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1339431.html