基于改进CURE算法的微博热点话题发现
[Abstract]:Due to the large amount of information on Weibo platform, an improved algorithm based on classical CURE clustering algorithm is proposed to identify hot spots in blog posts. In this paper, 20391 Chinese characters Weibo are selected as sample data sets, and the accuracy and speed of calculation are greatly improved by reducing the dimension of high-dimensional data by thinning matrix. Based on the selection of representative points of CURE hierarchical clustering, the representative points are transformed into the seed set of blog posts, and the contraction factors are adjusted, and the abnormal points of eliminating blog posts are increased. Using the idea of CURE hierarchical clustering algorithm, an improved CURE algorithm is designed to find hot topics of Weibo. It is found through experiments that the improved CURE hierarchical clustering algorithm can take 74.65% of the data set as the outlier, which improves the accuracy of the algorithm better. At the same time, accurately grasp the long tail effect of the "head", can more intuitively find Weibo hot topic.
【作者单位】: 常州大学信息科学与工程学院;
【基金】:国家自然科学基金项目(61272367) 江苏省科技厅项目(BZ2010021) 江苏省研究生培养创新工程项目(20120515)
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 姚远;刘鹏;王辉;笱程成;;基于稀疏矩阵存储的状态表压缩算法[J];计算机应用;2010年08期
2 李永昊;刘云;;网络话题活性模型的仿真与分析[J];系统仿真学报;2008年22期
3 王皓;李祥学;郑东;;基于稀疏矩阵的网络编码安全存储系统[J];信息安全与通信保密;2011年06期
4 倪现君;;结构挖掘中web有向图模型的改进算法[J];微计算机信息;2007年36期
5 贺海武;王宇;;GMRES算法在新型轻量级网格平台XtremWeb上的实现[J];微电子学与计算机;2006年09期
6 张媛媛;侯华;程军;赵宇辉;;一种有限元网格节点编号的优化算法[J];铸造技术;2007年04期
7 刘慧君;朱庆生;张程;周明强;;基于用户兴趣的Web日志挖掘算法[J];计算机集成制造系统;2009年11期
8 刘葵;;基于链接聚类算法分析Blog网页[J];制造业自动化;2010年09期
9 ;[J];;年期
10 ;[J];;年期
相关会议论文 前2条
1 樊景超;周国民;周义桃;;基于SDD改进算法的中文农业搜索引擎的研究[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年
2 贺海武;王宇;;GMRES算法在新型轻量级网格平台XtremWeb上的实现[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
相关硕士学位论文 前10条
1 罗亚平;基于用户浏览行为的网络热点话题发现模型研究[D];北京邮电大学;2008年
2 周瑞波;网络研究中的大稀疏矩阵求解和通信流量对蠕虫传播推测的影响[D];吉林大学;2008年
3 时达明;Blog热点话题发现及其作者声誉度研究[D];大连理工大学;2007年
4 黄振龙;关于微博热点的WEB挖掘研究[D];华东师范大学;2013年
5 李卉;基于微博的网络突发事件分析研究[D];北京邮电大学;2013年
6 任晓霞;BBS舆情智能分析系统研究与实现[D];沈阳理工大学;2011年
7 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
8 李永道;微博热点话题发现方法研究[D];南京师范大学;2013年
9 鄂华君;基于P2P的网络编码的应用与分析[D];西安电子科技大学;2010年
10 李纯;P2P网络中基于内容的音乐信息检索[D];大连理工大学;2010年
,本文编号:2323794
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2323794.html