基于群体智能聚类研究及其在股市板块分析中的应用
本文关键词: 数据挖掘 股市板块 果蝇优化算法 近邻传播聚类算法 实时学习 差异化距离 出处:《长春工业大学》2017年硕士论文 论文类型:学位论文
【摘要】:大数据时代背景下,股票市场产生的数据越来越多,传统分析方法已很难满足现代对股市板块分析的需求,如何从海量股票数据中挖掘出有用信息,并对股市板块进行分析和预测成为了一个重要的研究课题。数据挖掘作为一种新的数据技术在此环境背景下迅速发展,为开发数据信息资源做出重大贡献。聚类是一种无监督学习的数据挖掘技术,可以充分地分析数据内部特征和数据间的联系。通过形成的多个簇,挖掘出数据之间潜在的联系与特征,避免直面庞大的数据集。群体智能算法是一种演化计算技术,具有实现简单、收敛速度快、全局收敛性优等优点,已受到越来越多国内外专家和学者的关注。群体智能优化算法是人工智能的一个重要分支,与人工生命联系紧密。通过模拟自然界生物群体的各种行为,利用个体之间的信息传递和合作实现寻优的目的。果蝇优化算法(Fruit Fly Optimization Algorithm,FOA)是群体智能优化算法的一种,因其寻优精度高且设置参数少,已经广泛应用到多个领域。但是FOA仍然存在不足:FOA在处理复杂函数问题时,收敛速度减慢,且收敛精度降低。针对此问题提出一种实时学习的果蝇优化算法(A Real-Time Learning Fruit Fly Optimization Algorithm,RTLFOA)。RTLFOA通过实时的获取种群知识,在种群陷入早熟时,通过获取的种群经验引导果蝇群体进行不同尺度的变异。变异后,味道浓度较差位置处的果蝇个体进行全局搜索,提高算法的收敛速度;味道浓度较优位置处的果蝇个体进一步对局部区域进行搜索,提高收敛精度。通过比较RTLFOA与其它算法对基准函数收敛性的测试结果,证明了RTLFOA有效的提高了收敛速度和收敛精度。近邻传播聚类算法(Affinity Propagation,AP)是一种无监督学习的聚类算法,不必指定聚类数目且处理大规模数据集具有较好的聚类结果。但是AP聚类算法的偏向参数设置难度大。(1)基于群体智能优化算法的全局搜索能力,首先提出基于差异化距离的果蝇优化算法(Fruit Fly Optimization Algorithm based on Differential Distance,FOADD)。FOADD算法使距离原点相同距离处的果蝇同时移动,避免了无效移动,提高算法的搜索效率。(2)基于FOADD的快速搜索能力,提出基于差异化距离果蝇优化的近邻传播聚类算法(Affinity Propagation based on FOADD,AP-FOADD)。在搜索空间内对偏向参数进行寻优,并使用经典数据集进行测试,根据Silhouette有效性指标与聚类结果证明其有效性。基于AP-FOADD聚类算法,对股市板块进行分析。本文选取了112家北京上市公司,并以四项可以反映上市公司盈利能力的财务指标为研究对象,对上市公司聚类。通过聚类结果对上市公司的经营能力、发展潜力进行分析,并根据上市公司年度报告证明聚类结果的有效性,为投资者提供投资组合、规避投资风险提供理论依据。
[Abstract]:Under the background of big data era, more and more data are produced in the stock market. The traditional analysis method has been difficult to meet the needs of the modern stock market plate analysis, how to extract useful information from the massive stock data. And the analysis and prediction of the stock market has become an important research topic. As a new data technology, data mining is developing rapidly in this environment. Clustering is an unsupervised learning data mining technology, which can fully analyze the relationship between the internal characteristics of data and data. Through the formation of multiple clusters. In order to avoid facing the huge data set, swarm intelligence algorithm is a kind of evolutionary computing technology, which has the advantages of simple implementation, fast convergence speed and excellent global convergence. Swarm intelligence optimization algorithm is an important branch of artificial intelligence, which is closely related to artificial life. Fruit Fly Optimization Algorithm was optimized by using the information transmission and cooperation among individuals. FOAis a kind of swarm intelligence optimization algorithm, which has been widely used in many fields because of its high precision and low parameter setting. However, FOA still has shortcomings in dealing with complex function problems. The rate of convergence slows down. And the convergence accuracy is reduced. A real-time learning algorithm for Drosophila is proposed. A Real-Time Learning Fruit Fly Optimization Algorithm. RTLFOA).RTLFOA acquires population knowledge in real time. When the population falls into early maturity, the acquired population experience leads Drosophila populations to mutate on different scales. In order to improve the convergence rate of the algorithm, the individual of Drosophila melanogaster at the location of poor taste concentration is searched globally. In order to improve the convergence accuracy, the individual of Drosophila melanogaster at the optimal location of flavor concentration further searched the local area to improve the convergence accuracy. By comparing the results of RTLFOA and other algorithms to test the convergence of reference function. It is proved that RTLFOA can effectively improve the convergence speed and accuracy. The near neighbor propagation clustering algorithm is Affinity Propagation. App) is an unsupervised learning clustering algorithm. There is no need to specify the number of clustering and processing large data sets has better clustering results, but AP clustering algorithm is difficult to set the bias parameters.) based on the global search ability of swarm intelligence optimization algorithm. First of all, an optimization algorithm for Drosophila based on differential distance is proposed (. Fruit Fly Optimization Algorithm based on Differential Distance. FOADD).FOADD algorithm makes Drosophila at the same distance from origin to move at the same time, avoids invalid movement, and improves search efficiency. 2) Fast search ability based on FOADD. A neighbor propagation clustering algorithm, Affinity Propagation based on FOADD, is proposed based on the optimization of the differential distance of Drosophila melanogaster. AP-FOADD. to optimize the bias parameters in the search space, and use the classical data set to test. According to the Silhouette validity index and clustering results to prove its validity. Based on the AP-FOADD clustering algorithm, the stock market block is analyzed. In this paper, 112 listed companies in Beijing are selected. And taking four financial indexes which can reflect the profitability of listed companies as the research object, this paper analyzes the business ability and development potential of listed companies through clustering results. According to the annual report of listed companies, the validity of clustering results is proved, which provides a theoretical basis for investors to invest portfolio and avoid investment risk.
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:F832.51;TP311.13
【相似文献】
相关期刊论文 前10条
1 何小贤,朱云龙,王玫;群体智能中的知识涌现与复杂适应性问题综述研究[J];信息与控制;2005年05期
2 张燕,康琦,汪镭,吴启迪;群体智能[J];冶金自动化;2005年02期
3 杨东升;康琦;刘波;汪镭;吴启迪;;面向生产系统的残次品主次成因的群体智能分析[J];智能系统学报;2009年06期
4 余建平;周新民;陈明;;群体智能典型算法研究综述[J];计算机工程与应用;2010年25期
5 吴尤可;王田;;基于蚁群群体智能理论的创新政策扩散研究[J];科学学与科学技术管理;2014年04期
6 凌海峰,杨善林,刘业政;基于群体智能的蚁群算法研究[J];合肥工业大学学报(自然科学版);2005年06期
7 黄应申;;群体智能在图书馆信息化改造中的应用[J];图书馆学刊;2009年08期
8 王芳;谢克明;刘建霞;;基于群体智能的思维进化算法设计[J];控制与决策;2010年01期
9 陈世明,方华京;大规模智能群体的建模及稳定性分析[J];控制与决策;2005年05期
10 陈云飞,刘玉树,钱越英,赵基海;一种基于密度的启发性群体智能聚类算法[J];北京理工大学学报;2005年01期
相关会议论文 前5条
1 孙长银;冯纯伯;夏良正;;群体智能——最优化技术的一种新的有效实现模式[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
2 安静;康琦;汪镭;吴启迪;;群体智能及其在BPR中的应用[A];《制造业自动化与网络化制造》学术交流会论文集[C];2004年
3 张国英;周俊武;沙芸;;基于约束惩罚的群体智能聚类算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
4 安静;康琦;汪镭;吴启迪;;群体智能及其在BPR中的应用[A];先进制造技术论坛暨第三届制造业自动化与信息化技术交流会论文集[C];2004年
5 康琦;杨东升;汪镭;吴启迪;;半导体封装作业调度的群体智能近似动态优化[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
相关博士学位论文 前6条
1 王康平;群体智能新方法在优化和模拟中的研究[D];吉林大学;2008年
2 薛晗;不确定规划的群体智能计算[D];国防科学技术大学;2010年
3 王学厚;群体智能优化的计算模式和方法研究与应用[D];华北电力大学;2011年
4 王巧灵;基于群体智能混合优化算法的研究[D];哈尔滨工业大学;2010年
5 高政威;模拟生物群体智能的优化方法及其应用研究[D];东北大学;2012年
6 张晓明;基于种子传播方式和植物分布演化的种子优化算法研究[D];中国科学技术大学;2011年
相关硕士学位论文 前10条
1 宋建国;果蝇优化算法的改进研究[D];江西理工大学;2015年
2 唐超宇;基于群体智能的超多目标优化算法研究[D];深圳大学;2016年
3 刘志江;基于群体智能的微博公众情感预测方法[D];华中科技大学;2015年
4 邱兵;基于群体智能聚类研究及其在股市板块分析中的应用[D];长春工业大学;2017年
5 刘运源;混沌群体智能及其优化算法的研究和应用[D];武汉科技大学;2008年
6 束建华;群体智能及其在分布式知识管理中的应用研究[D];合肥工业大学;2007年
7 王会颖;蚁群算法及群体智能的应用研究[D];安徽大学;2007年
8 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
9 张文斌;群体智能涌现在网络舆情预测中的应用[D];西南交通大学;2011年
10 赵磊;基于群体智能的分子对接算法研究与实现[D];大连理工大学;2013年
,本文编号:1455984
本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/1455984.html