微博自动分类系统设计
本文关键词:微博自动分类系统设计
【摘要】:文章提出了一种热门微博分类的新思路,通过对热门微博的转发用户进行聚类分析,并根据不同的用户聚集状态来区分不同种类的热门微博。在用户聚类中采用了基于K-means聚类算法的改进算法X-means,并根据微博用户数据特点对X-means算法进行了进一步改进,将属性差异和用户节点差异考虑在聚类过程当中。其中,在对X-means算法改进过程中,对于用户属性的加权采用了基于对数函数的加权方式,确保聚类结果更加科学、准确;在对用户自身权重的加权中,通过建立重点人员信息库的方式,实现了对特殊用户节点的加权,并利用HITS算法对重点人员信息库实现动态更新。在完成用户聚类之后,将得到的重要用户的信息分领域录入重点人员信息库,实现聚类过程与信息库的反馈机制。另外,实验将相同数据分别代入改进前后的K-means算法与X-means算法中,并通过轮廓系数评价聚类结果,证明了改进后的X-means算法在微博用户聚类中更有优势。
【作者单位】: 中国人民公安大学网络安全保卫学院;
【关键词】: 微博分类 用户聚类 轮廓系数
【基金】:公安部重点研究计划[2011ZDYJGADX016]
【分类号】:TP391.1
【正文快照】: 0引言在新兴的互联网时代,微博作为一种短内容交互式的社交平台已经成为人们发表意见、共享信息的一种主要工具。而随着微博的普及,在微博中也出现了许多影响社会稳定、危害社会治安的舆情事件,其中包括诽谤、谣言、反动言论以及恐吓威胁等内容。公安网监部门必须仔细地对微博
【相似文献】
中国期刊全文数据库 前10条
1 丁向荣;;基于用户聚类的框计算改进模型研究[J];科技通报;2012年12期
2 王荣;李晋宏;宋威;;基于关键字的用户聚类算法[J];计算机工程与设计;2012年09期
3 张晨;;集群环境下用户聚类算法的智能化站点的架构[J];硅谷;2012年24期
4 彭艳;王小玲;;一种混合聚类算法在用户聚类中的应用研究[J];信息技术;2008年01期
5 张海荣;朱信忠;赵建民;徐慧英;;一种优化的基于用户聚类的过滤推荐策略[J];计算机系统应用;2008年11期
6 王燕;孙玲芳;徐曰光;陈思光;黎维良;王雁秋;闫超;;基于高效多功能的聚类算法在Web挖掘中应用的研究[J];科学技术与工程;2008年04期
7 赵洁;董振宁;张沙清;肖南峰;;一种基于粒度原理的多指标综合Web用户聚类算法[J];计算机应用研究;2011年07期
8 刘芳先;李国;;基于项目簇偏好的用户聚类算法[J];现代计算机;2013年18期
9 王琼;顾文轩;徐汀荣;;结合关联规则与FCM的用户聚类改进[J];微电子学与计算机;2008年03期
10 翁伟;朱顺痣;钟瑛;;基于访问路径的Web用户聚类算法[J];福建电脑;2013年01期
中国博士学位论文全文数据库 前1条
1 赵洁;基于粒计算的Web使用挖掘研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前9条
1 顾振宇;基于点击的用户聚类的研究[D];电子科技大学;2011年
2 陈泽红;基于Web访问日志的用户聚类研究[D];厦门大学;2014年
3 付志涛;基于Web日志的网络用户聚类研究与实现[D];南京理工大学;2007年
4 蒋超;基于用户聚类和语义词典的微博推荐系统[D];浙江大学;2013年
5 肖宗花;基于用户访问行为与内容的用户聚类算法的研究与实现[D];北京交通大学;2013年
6 郝建斌;基于模糊理论的Web用户聚类的研究[D];北京理工大学;2011年
7 周松松;基于MapReduce用户聚类算法在Web日志挖掘中应用[D];河北工业大学;2015年
8 杨登武;基于改进的混合蛙跳算法的Web用户聚类研究[D];西南大学;2015年
9 郑富兰;基于Web用户聚类的多Markov链预测模型研究[D];山西师范大学;2013年
,本文编号:742279
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/742279.html