数据挖掘方法在股票选择中的应用研究
发布时间:2021-05-01 03:49
我国股市经过近三十年的不断发展,股票市场逐渐走向成熟,股票的分析方法、分析手段也趋向于多元化。当前股票的传统分析方法主要有基本面分析方法和技术面分析方法。但是随着股票市场数据的不断扩充,传统分析方法在处理大数据时消耗时间长、依赖人的主观判断、和难以快速的发现数据内部间规律性的弊端不断显现。随着人工智能、数据挖掘、机器学习技术的不断发展,将这些技术运用到股票数据分析的情形在海内外基金公司中不断出现。基金公司运用新的数据挖掘方法是为了能够获得超越指数收益的股票。论文从众多数据挖掘技术中选择四种数据挖掘技术,寻找具有超额收益的股票特征。运用的数据挖掘方法包括关联规则,主成分分析,决策树模型和深度神经网络模型等。所选择的股票特征包括反映公司整体财务状况的财报指标,外部行业指标、技术类指标,一致预期类指标、估值类指标等五大类指标。由于各类指标内部具有很强的相关性,如果同时把所有指标输入到数据挖掘模型内,容易造成多重共线性导致的参数估计不显著等问题。所以论文将采用关联规则和主成分分析两种数据降维的方法对数据进行预处理,将通过降维的高浓度数据作为输入变量分别输入到决策树模型和深度神经网络模型中,来预...
【文章来源】:对外经济贸易大学北京市 211工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 引言
1.1 研究背景
1.2 研究意义
1.3 文献综述
1.3.1 国外研究现状
1.3.2 国内研究现状
1.4 技术路线和论文结构
1.4.1 研究思路
1.4.2 研究方法
1.5 创新之处
第二章 理论基础
2.1 数据挖掘概念界定
2.2 数据挖掘技术流程
2.3 数据挖掘技术的操作方法
2.4 数据挖掘成果的验证和评估
第三章 股票核心指标提取和数据清洗方案
3.1 数据挖掘指标的选取和清洗标准
3.1.1 股票指标的时间区间
3.1.2 剔除被交易所警告有可能出现退市情况的股票
3.1.3 剔除股票数据不全的股票
3.1.4 样本选择
3.1.5 改进了数据清洗方法
3.2 数据挖掘指标的选取
3.2.1 输入变量
3.2.2 目标变量
第四章 利用非监督学习模型对指标进行降维
4.1 关联规则数据挖掘
4.1.1 关联规则的原理和计算步骤
4.1.2 关联规则的优缺点
4.2 利用关联规则对股票指标进行处理达到降维
4.2.1 数据预处理
4.2.2 运用关联规则处理经过整理后的数据
4.3 利用主成分分析(PCA)对数据进行处理
4.3.1 主成分分析的含义
4.3.2 主成分分析的计算步骤
4.3.3 主成分分析的优缺点分析
4.4 利用主成分分析(PCA)对股票数据进行降维处理
第五章 利用分类和预测模型进行建模分析
5.1 预测模型和分类模型含义
5.2 决策树数据挖掘方法概述
5.3 运用决策树模型处理股票特征数据
5.3.1 数据处理
5.3.2 决策树分析及评价
5.3.3 决策树模型效果展示
5.4 神经网络模型
5.4.1 神经网络概述
5.4.2 神经网络特点
5.5 神经网络数据挖掘
5.5.1 数据预处理
5.5.2 神经网络模型的拓扑结构
5.5.3 神经网络模型效果分析
5.5.4 神经网络模型的效果展示
第六章 决策树模型和神经网络模型对比分析
6.1 模型的比较的方法概述
6.2 四种模型比较方法下对比两个模型
6.2.1 偏差方差比较方法
6.2.2 ROC曲线判别方法
6.2.3 F1score比较方法
6.2.4 超额收益率方法
第七章 结论与展望
7.1 研究结论
7.2 研究展望
参考文献
致谢
个人简历在读期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]基于广义加性分位数回归的基金经理选股与择时能力评价[J]. 许启发,侯奇华,蒋翠侠. 财会月刊. 2017(35)
[2]股票信任分类基础上的投资组合选择[J]. 汪涌,黄东宾,杨宣. 经营管理者. 2017(09)
[3]数据挖掘在股票预测中的应用[J]. 张博凯. 当代经济. 2017(08)
[4]公开信息披露、媒体报道基调与股票价格行为——基于权益变动类信息的新闻报道视角[J]. 张磊. 会计之友. 2017(04)
[5]基于遗传算法的股票市场选择模型[J]. 戎容,吴萍. 计算机工程与应用. 2016(18)
[6]投资者情绪对股价的影响——基于AH股交叉上市股票的实证分析[J]. 陆静,周媛. 中国管理科学. 2015(11)
[7]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬. 计算机与现代化. 2015(10)
[8]技术分析的经济收益与市场有效性[J]. 汪天都,孙谦. 国际商务研究. 2015(05)
[9]基于支持向量机的股票预测[J]. 刘廷. 信息通信. 2015(08)
[10]股票回购的市场时机选择及其影响因素研究[J]. 姜英兵,屈慧敏. 财务研究. 2015(04)
本文编号:3170087
【文章来源】:对外经济贸易大学北京市 211工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第一章 引言
1.1 研究背景
1.2 研究意义
1.3 文献综述
1.3.1 国外研究现状
1.3.2 国内研究现状
1.4 技术路线和论文结构
1.4.1 研究思路
1.4.2 研究方法
1.5 创新之处
第二章 理论基础
2.1 数据挖掘概念界定
2.2 数据挖掘技术流程
2.3 数据挖掘技术的操作方法
2.4 数据挖掘成果的验证和评估
第三章 股票核心指标提取和数据清洗方案
3.1 数据挖掘指标的选取和清洗标准
3.1.1 股票指标的时间区间
3.1.2 剔除被交易所警告有可能出现退市情况的股票
3.1.3 剔除股票数据不全的股票
3.1.4 样本选择
3.1.5 改进了数据清洗方法
3.2 数据挖掘指标的选取
3.2.1 输入变量
3.2.2 目标变量
第四章 利用非监督学习模型对指标进行降维
4.1 关联规则数据挖掘
4.1.1 关联规则的原理和计算步骤
4.1.2 关联规则的优缺点
4.2 利用关联规则对股票指标进行处理达到降维
4.2.1 数据预处理
4.2.2 运用关联规则处理经过整理后的数据
4.3 利用主成分分析(PCA)对数据进行处理
4.3.1 主成分分析的含义
4.3.2 主成分分析的计算步骤
4.3.3 主成分分析的优缺点分析
4.4 利用主成分分析(PCA)对股票数据进行降维处理
第五章 利用分类和预测模型进行建模分析
5.1 预测模型和分类模型含义
5.2 决策树数据挖掘方法概述
5.3 运用决策树模型处理股票特征数据
5.3.1 数据处理
5.3.2 决策树分析及评价
5.3.3 决策树模型效果展示
5.4 神经网络模型
5.4.1 神经网络概述
5.4.2 神经网络特点
5.5 神经网络数据挖掘
5.5.1 数据预处理
5.5.2 神经网络模型的拓扑结构
5.5.3 神经网络模型效果分析
5.5.4 神经网络模型的效果展示
第六章 决策树模型和神经网络模型对比分析
6.1 模型的比较的方法概述
6.2 四种模型比较方法下对比两个模型
6.2.1 偏差方差比较方法
6.2.2 ROC曲线判别方法
6.2.3 F1score比较方法
6.2.4 超额收益率方法
第七章 结论与展望
7.1 研究结论
7.2 研究展望
参考文献
致谢
个人简历在读期间发表的学术论文与研究成果
【参考文献】:
期刊论文
[1]基于广义加性分位数回归的基金经理选股与择时能力评价[J]. 许启发,侯奇华,蒋翠侠. 财会月刊. 2017(35)
[2]股票信任分类基础上的投资组合选择[J]. 汪涌,黄东宾,杨宣. 经营管理者. 2017(09)
[3]数据挖掘在股票预测中的应用[J]. 张博凯. 当代经济. 2017(08)
[4]公开信息披露、媒体报道基调与股票价格行为——基于权益变动类信息的新闻报道视角[J]. 张磊. 会计之友. 2017(04)
[5]基于遗传算法的股票市场选择模型[J]. 戎容,吴萍. 计算机工程与应用. 2016(18)
[6]投资者情绪对股价的影响——基于AH股交叉上市股票的实证分析[J]. 陆静,周媛. 中国管理科学. 2015(11)
[7]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬. 计算机与现代化. 2015(10)
[8]技术分析的经济收益与市场有效性[J]. 汪天都,孙谦. 国际商务研究. 2015(05)
[9]基于支持向量机的股票预测[J]. 刘廷. 信息通信. 2015(08)
[10]股票回购的市场时机选择及其影响因素研究[J]. 姜英兵,屈慧敏. 财务研究. 2015(04)
本文编号:3170087
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/3170087.html