面向微博话题的粒子群优化聚类算法研究
本文关键词: 聚类分析 K-means算法 粒子群优化 Spark 出处:《河南理工大学》2016年硕士论文 论文类型:学位论文
【摘要】:Web技术的快速发展使微博成为人们进行沟通与交流的一种新型社交网络平台。在该平台上,用户可以自由地发表对某些话题的观点与看法。微博内容简单、发布容易的特点使其每天产生的信息总量巨大,从这些庞大的微博信息中提取出人们感兴趣的热点话题成为时下聚类分析的研究重点。本文的主要研究内容如下:(1)首先,在对聚类算法、粒子群优化算法(Particle Swarm Optimization,PSO)和微博话题的国内外研究现状进行阐述的基础上,深入研究和分析了聚类算法和PSO算法的基本原理及改进思想,同时根据项目和数据分析的需求成功搭建了用于处理大数据的Spark集群。(2)其次,提出了基于时间因子的混沌粒子群优化K-means算法(the K-means algorithm of Chaotic Particle swarm optimization with Time Factor),即KCPTF算法。在该算法中,为保证粒子的全局寻优能力,引入了反映时间效应的非线性递减时间因子,使粒子在算法初期可快定位在近最优解附近;为防止粒子群陷入局部最优解,引入了混沌寻优技术,利用混沌技术的遍历性增强粒子的全局搜索能力,并确保了粒子群的多样性,同时启用边界缓冲墙技术来动态调整越界粒子;将改进后的PSO算法与K-means算法进行合并。在Matlab上对UCI数据库中的数据集进行仿真测试,对比实验表明,KCPTF算法的聚类结果有更高的精确度。(3)最后,将本文提出的KCPTF算法应用在对新浪微博话题的聚类上,并在Spark平台上开发出了一个基于新浪微博的热点话题原型系统,该系统可聚类出一定时段内的热点话题,达到了项目在聚类方面的预期要求。
[Abstract]:With the rapid development of Web technology, Weibo has become a new social network platform for people to communicate and communicate. On this platform, users can freely express their views and opinions on certain topics. Weibo's content is simple. The ease of publishing makes the amount of information generated every day huge. Extracting hot topics of interest from these huge Weibo information has become the focus of cluster analysis. The main research contents of this paper are as follows: 1) first of all, the clustering algorithm is proposed. Particle Swarm Optimization algorithm (PSO) and Weibo topic research status at home and abroad are discussed. The basic principle and improved idea of clustering algorithm and PSO algorithm are deeply studied and analyzed. At the same time, according to the requirements of the project and data analysis, the Spark cluster used to deal with big data is successfully built. A chaotic particle swarm optimization K-means algorithm based on time factor is proposed. The K-means algorithm of Chaotic Particle swarm optimization with. Time Factor). . In order to ensure the global optimization ability of particles, a nonlinear decrement time factor is introduced, which reflects the time effect, so that the particles can be located near the near optimal solution in the initial stage of the algorithm. In order to prevent particle swarm from falling into local optimal solution, chaos optimization technique is introduced. The global searching ability of particle is enhanced by using the ergodicity of chaos technology, and the diversity of particle swarm is ensured. At the same time, the boundary buffer wall technology is used to dynamically adjust the cross boundary particles; The improved PSO algorithm is combined with K-means algorithm. The data set in UCI database is simulated on Matlab. The clustering result of KCPTF algorithm has higher accuracy. Finally, the KCPTF algorithm proposed in this paper is applied to the clustering of Sina Weibo topic. A hot topic prototype system based on Sina Weibo is developed on Spark platform. The system can cluster the hot topics in a certain period of time and meet the expected requirements of the project in clustering.
【学位授予单位】:河南理工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.092;TP311.13
【相似文献】
相关期刊论文 前10条
1 蒙正中;;一种改进的混合粒子群优化算法[J];桂林工学院学报;2009年03期
2 吴昌友;王福林;马力;;一种新的改进粒子群优化算法[J];控制工程;2010年03期
3 周驰,高海兵,高亮,章万国;粒子群优化算法[J];计算机应用研究;2003年12期
4 高鹰,谢胜利;免疫粒子群优化算法[J];计算机工程与应用;2004年06期
5 张荣沂;一种新的集群优化方法——粒子群优化算法[J];黑龙江工程学院学报;2004年04期
6 高鹰;谢胜利;;混沌粒子群优化算法[J];计算机科学;2004年08期
7 刘钊,康立山,蒋良孝,杨林权;用粒子群优化改进算法求解混合整数非线性规划问题[J];小型微型计算机系统;2005年06期
8 戴冬雪,王祁,阮永顺,王晓超;基于混沌思想的粒子群优化算法及其应用[J];华中科技大学学报(自然科学版);2005年10期
9 窦全胜;周春光;马铭;刘全;;群核进化粒子群优化方法[J];计算机科学;2005年08期
10 范娜;云庆夏;;粒子群优化算法及其应用[J];信息技术;2006年01期
相关会议论文 前10条
1 张妍;张晓光;王永钢;;几种改进型的粒子群优化算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
2 孙红光;潘毓学;;基于运动目标路径的粒子群优化算法研究[A];第二届全国信息获取与处理学术会议论文集[C];2004年
3 韩毅;唐加福;郭伟宏;刘阳;;混合粒子群优化算法求解多层批量问题(英文)[A];中国运筹学会第八届学术交流会论文集[C];2006年
4 金一粟;梁逸曾;;空间自适应粒子群优化算法的应用研究[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
5 汪荣贵;李守毅;孙见青;;一种新的自适应粒子群优化算法及应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 黄双欢;程良伦;;一种基于粒子群优化的快速图像倾斜角度检测算法[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
7 侯志荣;吕振肃;;基于退火策略的粒子群优化算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 徐俊杰;忻展红;;基于增强型参考位置的粒子群优化模型[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
9 王亚;于永光;耿玲玲;;一类改进的自适应粒子群优化算法对混沌系统未知参数的估计[A];中国力学大会——2013论文摘要集[C];2013年
10 崔静;邓方;方浩;;基于改进粒子群优化算法的弹道求解方法[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
相关博士学位论文 前10条
1 刘昊;多样性增强的粒子群优化算法及其应用研究[D];北京理工大学;2015年
2 姜毅;动态环境下粒子群优化算法的研究[D];武汉大学;2013年
3 Shafiullah Khan;粒子群优化算法及其在电磁设计中的应用[D];浙江大学;2017年
4 刘华蓥;粒子群优化算法的改进研究及在石油工程中的应用[D];东北石油大学;2012年
5 刘波;粒子群优化算法及其在机电设备中的应用研究[D];中北大学;2011年
6 熊勇;粒子群优化算法的行为分析与应用实例[D];浙江大学;2005年
7 唐贤伦;混沌粒子群优化算法理论及应用研究[D];重庆大学;2007年
8 闫允一;粒子群优化及其在图像处理中的应用研究[D];西安电子科技大学;2008年
9 余炳辉;粒子群优化算法试验研究及扩展[D];华中科技大学;2007年
10 唐贤伦;混沌粒子群优化算法理论及应用[D];重庆大学;2007年
相关硕士学位论文 前10条
1 陈卓;粒子群优化算法的改进及在油藏数值模拟中的应用[D];北京建筑大学;2015年
2 白云;基于粒子群优化算法的复杂网络社区挖掘[D];西北农林科技大学;2015年
3 杨艳华;基于粒子群优化支持向量机的网络态势预测模型研究[D];兰州大学;2015年
4 孟亚州;基于粒子群优化OTSU的肺组织分割算法研究[D];宁夏大学;2015年
5 郑博;基于快速排序的多目标粒子群优化算法的研究及应用[D];郑州大学;2015年
6 米永强;非线性规划问题的混合粒子群优化算法研究[D];宁夏大学;2015年
7 李建美;基于自适应变异与文化框架的混沌粒子群优化算法[D];陕西师范大学;2015年
8 刘星;基于粒子群优化算法的特征选择方法研究[D];南京大学;2015年
9 牛旭;动态粒子群优化算法及其应用[D];西安电子科技大学;2014年
10 叶华;粒子群优化算法研究[D];西安电子科技大学;2014年
,本文编号:1478232
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1478232.html