面向证券行业数据的聚类分析及其应用研究
本文关键词:面向证券行业数据的聚类分析及其应用研究
【摘要】:聚类分析根据数据内在几何结构和数据间的相似性,发掘出数据中隐藏的结构特征,并可通过可视化的形式进行展现。在证券市场上,对数据的获取、利用和分析程度,直接关系到证券投资者是否可以获得满意的收益。但是证券数据具有种类繁多、结构复杂等特性,因此如何高效进行数据的表示和分析是一个具有挑战性的课题。本项目主要采用聚类分析的方法对证券数据进行结构分析和可视化研究,具体包括:(1)在证券投资分析中,可以综合股票的各项基本因素进行聚类。利用多种聚类分析技术,同时结合证券数据的特殊性,衡量证券样本的相似程度,实现上市公司股票分类。通过聚类分析结果,找出不同公司股票之间的异同规律,探索不同股票的潜在特性,最终使投资者更好的确立投资范围和实现更高投资回报。(2)本文采用了多种聚类分析技术对股票交易数据进行对比分析发现,通过研究发现几种聚类算法各有特点,但都得到相似的结果。实验表明聚类分析可以很好的将不同行业的股票数据区分开来,并通过定量的方式给出不同股票交易数据之间的相似程度。(3)在证券投资研究中,股票交易的行情数据是一种常见的时间序列数据,即是在顺序的时间节点采集得到的数据。如果说财务数据反映的是上市公司的内在价值,那么行情数据则直接体现了股票交易的市场价格,更有实际意义,因此也具有更重要的研究价值,因此本文也尝试对上证50指数和创业板指数的成分股行情数据做聚类分析。通过理论分析和实验证明,对证券行业数据进行聚类分析,可以准确了解和把握证券市场的整体结构,帮助投资者整体了解股票特性,有助于投资者在此基础上进一步做出投资决策。
【关键词】:聚类分析 股票 时间序列
【学位授予单位】:苏州大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:F832.51;TP311.13
【目录】:
- 中文摘要4-5
- Abstract5-8
- 第一章 绪论8-11
- 1.1 选题背景8-9
- 1.2 本文主要工作和组织结构9-11
- 1.2.1 本文主要工作9-10
- 1.2.2 论文组织结构10-11
- 第二章 聚类分析方法介绍11-23
- 2.1 聚类分析概述11
- 2.2 常见聚类算法11-14
- 2.2.1 K均值11-12
- 2.2.2 层次聚类12-13
- 2.2.3 近邻传播聚类13-14
- 2.3 距离和相似性度量14-17
- 2.3.1 明氏距离15
- 2.3.2 马氏距离15-16
- 2.3.3 动态时间归整距离16
- 2.3.4 相关系数距离16-17
- 2.4 聚类有效性验证17-20
- 2.4.1 Davies-Bouldin指数18-19
- 2.4.2 DI指标19-20
- 2.4.3 Silhouette指标20
- 2.5 时间序列上的聚类分析20-22
- 2.5.1 时间序列分析介绍20-21
- 2.5.2 时间序列上的聚类分析21-22
- 2.6 小结22-23
- 第三章 公司财务数据的聚类分析23-39
- 3.1 指标选取23-26
- 3.1.1 成长能力23-24
- 3.1.2 盈利能力24
- 3.1.3 盈利质量24-25
- 3.1.4 营运能力25
- 3.1.5 股本扩张能力25
- 3.1.6 财务风险25-26
- 3.2 数据收集和处理26-30
- 3.2.1 数据收集26-28
- 3.2.2 数据处理28-30
- 3.3 实验方案30
- 3.4 实验结果30-38
- 3.4.1 聚类结果(K-means算法)30-34
- 3.4.2 聚类结果(其他聚类算法)34-37
- 3.4.3 聚类结果(使用未归一化的原始数据)37-38
- 3.5 小结38-39
- 第四章 行情数据的聚类分析39-47
- 4.1 数据收集和处理39-41
- 4.2 实验方案41
- 4.3 实验结果及分析41-46
- 4.3.1 聚类结果(使用相关系数距离)41-45
- 4.3.2 聚类结果(使用欧氏距离)45-46
- 4.4 小结46-47
- 第五章 结论与展望47-48
- 5.1 结论47
- 5.2 展望47-48
- 参考文献48-54
- 致谢54-55
【相似文献】
中国期刊全文数据库 前10条
1 李斌,郭剑毅;聚类分析在客户关系管理中的研究与应用[J];计算机工程与设计;2005年02期
2 张宏翔;李星;;基于聚类分析的学生学习相关性研究[J];计算机光盘软件与应用;2013年11期
3 蔡建国;;排序聚类分析在成组技术中的应用[J];机械工艺师;1985年01期
4 董玉祥;排序聚类分析计算程序[J];成组生产系统;1986年01期
5 A·Gongaware,Inyong Ham,焦虹;用于成组制造系统的聚类分析法[J];成组生产系统;1986年02期
6 史逸芬,蔡建国;排序聚类分析法在相似零件成组中的应用[J];成组生产系统;1986年03期
7 徐大威,王鸿歌;聚类分析应用程序系统[J];冶金自动化;1988年01期
8 张春早;会议评判与聚类分析[J];机械工程;1988年02期
9 吴国安;聚类分析在鸟的分类中的应用[J];黑龙江大学自然科学学报;1989年04期
10 卢泽生;;零件分类成组的聚类分析法[J];机械工程师;1990年04期
中国重要会议论文全文数据库 前10条
1 梅翠;;我国各地区居民收入差距及其对消费的制约[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 李均立;傅国华;;海南各县(市)经济实力的聚类分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 刘黄金;曹林峰;;南京服务业发展的聚类分析[A];江苏省现场统计研究会第十次学术年会论文集[C];2006年
4 肖静;杨泽峰;徐辰武;;微阵列表达谱监督聚类分析方法的比较研究[A];江苏省遗传学会第七届代表大会暨学术研讨会论文摘要汇编[C];2006年
5 路爱峰;崔玉杰;;沪市电力上市公司经营业绩的聚类分析[A];中国数学力学物理学高新技术交叉研究学会第十二届学术年会论文集[C];2008年
6 陈国华;廖小莲;夏君;;证券投资分析的聚类分析方法[A];中国企业运筹学[2011(1)][C];2011年
7 张红卫;隗金水;;聚类分析评价与测量效度关系探讨[A];第九届全国体育科学大会论文摘要汇编(4)[C];2011年
8 牛东晓;乞建勋;;网络资源平衡问题的聚类分析优化遗传算法研究[A];2001年中国管理科学学术会议论文集[C];2001年
9 詹原瑞;彭书杰;李如一;;基于聚类分析的企业信用等级评价方法[A];西部开发与系统工程——中国系统工程学会第12届年会论文集[C];2002年
10 邹晓玫;修春波;;基于聚类分析的犯罪率相关因素的研究[A];当代法学论坛(二○一○年第3辑)[C];2010年
中国博士学位论文全文数据库 前4条
1 张建萍;基于计算智能技术的聚类分析研究与应用[D];山东师范大学;2014年
2 李成安;分布式环境下聚类分析新方法的研究[D];浙江大学;2006年
3 杨旭杰;基于统计方法模型分析的中药复方专利保护研究[D];北京中医药大学;2012年
4 李宝玲;王裕颐教授学术思想与临床经验总结及治疗眩晕证治规律研究[D];北京中医药大学;2012年
中国硕士学位论文全文数据库 前10条
1 李元俊;大学生就业能力培养与社会需求的匹配性研究[D];山东建筑大学;2015年
2 冯雪冰;基于模糊理论的EM算法在聚类分析的应用研究[D];中国地质大学(北京);2015年
3 黄银;行业地区发展水平的聚类分析[D];苏州大学;2015年
4 郭俊峰;聚类分析下的股票投资价值挖掘研究[D];大连海事大学;2015年
5 张旭;考虑风电接入不确定性的节点特性建模研究[D];山东大学;2015年
6 褚旭;我国各省市CDM项目聚类分析及影响因素研究[D];首都经济贸易大学;2015年
7 刘鑫琳;VAGUE集理论及其在聚类分析中的应用[D];广西大学;2015年
8 周颖;基于蚁群算法的聚类分析在学生成绩中的研究[D];南昌大学;2015年
9 邢蕊;以聚类分析为基础的我国证券公司效率研究[D];山西大学;2015年
10 王帅宇;K-Means算法在用户细分方面的应用研究[D];北京理工大学;2015年
,本文编号:548041
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/548041.html