基于数据挖掘技术的股票数据分析研究
发布时间:2023-06-13 20:02
我国股票市场经历了将近三十年的成长,已经变成我国资本市场的重要组成部分。与此同时,随着人民的收入水平的提高,股票投资已成为投资者进行资产配置的一种重要手段[1]。复杂多变的股票市场包含了许多非常庞大的数据,如何更好的利用这些数据,挖掘数据内的深度信息,成为新的挑战。长期以来普通技术手段分析的方式难以发掘庞大海量数据身后隐藏的信息。运用数据挖掘技术对股票进行分析能更好地挖掘出上市公司股票潜在的有用信息和价值规律,帮助投资者做出正确的投资决定。本文根据股票数据的特点选择了相应的数据挖掘模型进行股票分析预测,针对投资者选择什么股票收益率更高这个问题来进行分析解决。主要分为三个部分:首先是寻找关键指标,由于影响股价走势的因素较多,本文利用关联规则分析找出具有参考意义有价值的,影响股价走势的20个股票关键指标。提升了有效性,避免过多的指标影响分析结果。然后依据关联分析的结果,对这20个关键指标进行聚类分析。通过对比不同聚类算法选择K-Means算法分析并对其做出算法改进,改进后的K-Means算法准确率明显提高。通过聚类分析结果可以看到较好的将优质股票进行聚类,对优质股和劣...
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究历史与现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文的主要贡献与创新
1.4 本论文的结构安排
第二章 数据挖掘技术
2.1 数据挖掘概述
2.2 数据挖掘的功能与过程
2.2.1 数据挖掘的功能
2.2.2 数据挖掘的过程
2.3 应用于股票预测的适用性分析
2.3.1 股票预测的困难性
2.3.2 应用领域
2.3.3 应用于股票分析的适用性
2.4 解决方案概述
2.4.1 功能需求
2.4.2 模块设计
2.4.3 技术需求
2.5 本章小结
第三章 基于关联分析的股票关键指标提取
3.1 关联规则
3.1.1 关联规则基本概念
3.1.2 关联规则的股票分析
3.2 基于APRIORI算法的关键指标挖掘
3.2.1 Apriori算法
3.2.2 数据准备
3.3 股票的关联规则分析
3.3.1 数据预处理
3.3.2 实验结果及分析
3.4 本章小结
第四章 基于改进K-MEANS算法的优质股票选取
4.1 聚类算法简介
4.1.1 聚类的概念
4.1.2 相似性度量
4.2 聚类算法
4.2.1 K均值算法
4.2.2 层次聚类算法
4.2.3 基于密度的聚类
4.3 基于改进K-MEANS算法的聚类分析
4.3.1 数据预处理
4.3.2 模型对比
4.3.3 基于K均值的改进
4.3.4 最优K值选取
4.4 实验结果与分析
4.5 本章小结
第五章 基于改进C5.0决策树的股票分析预测
5.1 决策树算法
5.2 C5.0决策树算法
5.2.1 特征选择
5.2.2 C5.0决策树算法的优缺点
5.3 BOOSTING提升算法
5.3.1 Boosting算法原理
5.3.2 决策树以及提升Boosting算法在股票分析中的可行性
5.4 基于C5.0算法的模型构建
5.4.1 数据预处理
5.4.2 评价指标
5.4.3 构建C5.0决策树模型
5.5 实验结果与分析
5.5.1 C5.0决策树算法实验
5.5.2 C5.0决策树结合Boosting五指标算法实验
5.5.3 C5.0决策树结合Boosting七指标算法实验
5.6 模型对比
5.7 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
本文编号:3833201
【文章页数】:73 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究工作的背景与意义
1.2 国内外研究历史与现状
1.2.1 国外研究现状
1.2.2 国内研究现状
1.3 本文的主要贡献与创新
1.4 本论文的结构安排
第二章 数据挖掘技术
2.1 数据挖掘概述
2.2 数据挖掘的功能与过程
2.2.1 数据挖掘的功能
2.2.2 数据挖掘的过程
2.3 应用于股票预测的适用性分析
2.3.1 股票预测的困难性
2.3.2 应用领域
2.3.3 应用于股票分析的适用性
2.4 解决方案概述
2.4.1 功能需求
2.4.2 模块设计
2.4.3 技术需求
2.5 本章小结
第三章 基于关联分析的股票关键指标提取
3.1 关联规则
3.1.1 关联规则基本概念
3.1.2 关联规则的股票分析
3.2 基于APRIORI算法的关键指标挖掘
3.2.1 Apriori算法
3.2.2 数据准备
3.3 股票的关联规则分析
3.3.1 数据预处理
3.3.2 实验结果及分析
3.4 本章小结
第四章 基于改进K-MEANS算法的优质股票选取
4.1 聚类算法简介
4.1.1 聚类的概念
4.1.2 相似性度量
4.2 聚类算法
4.2.1 K均值算法
4.2.2 层次聚类算法
4.2.3 基于密度的聚类
4.3 基于改进K-MEANS算法的聚类分析
4.3.1 数据预处理
4.3.2 模型对比
4.3.3 基于K均值的改进
4.3.4 最优K值选取
4.4 实验结果与分析
4.5 本章小结
第五章 基于改进C5.0决策树的股票分析预测
5.1 决策树算法
5.2 C5.0决策树算法
5.2.1 特征选择
5.2.2 C5.0决策树算法的优缺点
5.3 BOOSTING提升算法
5.3.1 Boosting算法原理
5.3.2 决策树以及提升Boosting算法在股票分析中的可行性
5.4 基于C5.0算法的模型构建
5.4.1 数据预处理
5.4.2 评价指标
5.4.3 构建C5.0决策树模型
5.5 实验结果与分析
5.5.1 C5.0决策树算法实验
5.5.2 C5.0决策树结合Boosting五指标算法实验
5.5.3 C5.0决策树结合Boosting七指标算法实验
5.6 模型对比
5.7 本章小结
第六章 全文总结与展望
6.1 全文总结
6.2 后续工作展望
致谢
参考文献
本文编号:3833201
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/3833201.html