基于Ada-CDT模型在股票涨跌多分类上的研究
发布时间:2021-07-13 12:04
股票是一种高风险且高收益的投资项目,投资者利用股票价格的变化得到差价收益。本文提出全新的模型对股票涨跌率进行三分类,根据结果为投资者在第二日开盘时提出买入、持中或卖出建议。本文提出一种全新的自适应级联决策树模型(Ada-CDT),将级联结构和结合,本文的创新为:一、引入错分代价系数对算法进行改进,增加实际意义;二、建立全新的模型,每层级联结构由决策树组成,弱分类器通过规则连接,这里的为引入代价系数后的改进算法;三、对股票涨跌率标签进行研究,确定分类标签阈值,选择处作为标签分类数值;并对同金融证券类型的股票进行相关性分析,选择强相关性的股票进行实证分析。将新模型Ada-CDT应用于股票分类上,根据收益对股票进行三分类,以中信证券股票(代码:600030)为基础股票,再选择其他同类型强相关性的13只股票进行实证分析,通过ROC曲线和AUC值来对模型进行评估,并对比四种算法。结果发现构建的模型在证券类股票上相较于其他算法有很好的分类效果。
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
一goFo此st算法多粒度扫描
?第3章Ada-CDT模型的构建??图3-2?Ada-CDT模型特征选取部分??如图3-2所示,我们用固定长度大小为m的滑块在特征集上进行滑动,特征集??中的总特征数为M。在这里要强调一下,由于特征之间有一定的相关性,所以我??们将M个特征打乱顺序后随机排列成一排,让滑块来滑动得到M?m?+1个特征子??集,为我们后续的级联结构中每一级的训练特征输入做准备。??3.?2.?2级联结构??在级联结构中,每一级为一个?^强分类器。由第二章介绍知,??由若干个弱分类器组合而成,这里我们用的弱分类器为C4.5决策树。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??图3-3?Ada-CDT模型级联部分??由图3-3所示,在级联结构中,每一级所用的样本均为同一个训练样本。在第??一层级联结构中
?第3章Ada-CDT模型的构建??图3-2?Ada-CDT模型特征选取部分??如图3-2所示,我们用固定长度大小为m的滑块在特征集上进行滑动,特征集??中的总特征数为M。在这里要强调一下,由于特征之间有一定的相关性,所以我??们将M个特征打乱顺序后随机排列成一排,让滑块来滑动得到M?m?+1个特征子??集,为我们后续的级联结构中每一级的训练特征输入做准备。??3.?2.?2级联结构??在级联结构中,每一级为一个?^强分类器。由第二章介绍知,??由若干个弱分类器组合而成,这里我们用的弱分类器为C4.5决策树。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??图3-3?Ada-CDT模型级联部分??由图3-3所示,在级联结构中,每一级所用的样本均为同一个训练样本。在第??一层级联结构中
【参考文献】:
期刊论文
[1]机构投资者对公司研发投入的影响研究——基于股票流动性视角[J]. 张根明,陈启实. 财会通讯. 2019(09)
[2]调和平均优化选择划分属性的决策树改进算法[J]. 王卓,聂斌,罗计根,杜建强,陈爱,周丽. 江西师范大学学报(自然科学版). 2018(04)
[3]股票价格预测中机器学习的应用[J]. 喻永生. 科技经济导刊. 2018(12)
[4]基于投资者情绪的股票价格及成交量预测研究[J]. 陈晓红,彭宛露,田美玉. 系统科学与数学. 2016(12)
[5]基于ARIMA模型的短期股票价格预测[J]. 吴玉霞,温欣. 统计与决策. 2016(23)
[6]基于样本权重的不平衡数据欠抽样方法[J]. 熊冰妍,王国胤,邓维斌. 计算机研究与发展. 2016(11)
[7]基于ARMA-GARCH模型的股票价格分析与预测[J]. 杨琦,曹显兵. 数学的实践与认识. 2016(06)
[8]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬. 计算机与现代化. 2015(10)
[9]基于粒子群算法的决策树SVM多分类方法研究[J]. 王道明,鲁昌华,蒋薇薇,肖明霞,李必然. 电子测量与仪器学报. 2015(04)
[10]基于代价敏感的AdaBoost算法改进[J]. 王学玲,王建林. 计算机应用与软件. 2013(10)
硕士论文
[1]一种新的不平衡数据处理方法在股票分类中的应用[D]. 张雨晴.北京交通大学 2018
[2]基于实时数据流处理的http数据分析可视化系统[D]. 潘冬.电子科技大学 2016
本文编号:3282026
【文章来源】:北京交通大学北京市 211工程院校 教育部直属院校
【文章页数】:48 页
【学位级别】:硕士
【部分图文】:
一goFo此st算法多粒度扫描
?第3章Ada-CDT模型的构建??图3-2?Ada-CDT模型特征选取部分??如图3-2所示,我们用固定长度大小为m的滑块在特征集上进行滑动,特征集??中的总特征数为M。在这里要强调一下,由于特征之间有一定的相关性,所以我??们将M个特征打乱顺序后随机排列成一排,让滑块来滑动得到M?m?+1个特征子??集,为我们后续的级联结构中每一级的训练特征输入做准备。??3.?2.?2级联结构??在级联结构中,每一级为一个?^强分类器。由第二章介绍知,??由若干个弱分类器组合而成,这里我们用的弱分类器为C4.5决策树。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??图3-3?Ada-CDT模型级联部分??由图3-3所示,在级联结构中,每一级所用的样本均为同一个训练样本。在第??一层级联结构中
?第3章Ada-CDT模型的构建??图3-2?Ada-CDT模型特征选取部分??如图3-2所示,我们用固定长度大小为m的滑块在特征集上进行滑动,特征集??中的总特征数为M。在这里要强调一下,由于特征之间有一定的相关性,所以我??们将M个特征打乱顺序后随机排列成一排,让滑块来滑动得到M?m?+1个特征子??集,为我们后续的级联结构中每一级的训练特征输入做准备。??3.?2.?2级联结构??在级联结构中,每一级为一个?^强分类器。由第二章介绍知,??由若干个弱分类器组合而成,这里我们用的弱分类器为C4.5决策树。??t?H?Rl?B??I?-?mu?-?匚二]?????1?al?.?□:!??a?*?<?*?<?*?<?栗??concatenate?議?|?|??I?L-l?L-l?i-l??Level?1?I?Level?2?|?I?Level?N??图3-3?Ada-CDT模型级联部分??由图3-3所示,在级联结构中,每一级所用的样本均为同一个训练样本。在第??一层级联结构中
【参考文献】:
期刊论文
[1]机构投资者对公司研发投入的影响研究——基于股票流动性视角[J]. 张根明,陈启实. 财会通讯. 2019(09)
[2]调和平均优化选择划分属性的决策树改进算法[J]. 王卓,聂斌,罗计根,杜建强,陈爱,周丽. 江西师范大学学报(自然科学版). 2018(04)
[3]股票价格预测中机器学习的应用[J]. 喻永生. 科技经济导刊. 2018(12)
[4]基于投资者情绪的股票价格及成交量预测研究[J]. 陈晓红,彭宛露,田美玉. 系统科学与数学. 2016(12)
[5]基于ARIMA模型的短期股票价格预测[J]. 吴玉霞,温欣. 统计与决策. 2016(23)
[6]基于样本权重的不平衡数据欠抽样方法[J]. 熊冰妍,王国胤,邓维斌. 计算机研究与发展. 2016(11)
[7]基于ARMA-GARCH模型的股票价格分析与预测[J]. 杨琦,曹显兵. 数学的实践与认识. 2016(06)
[8]基于C4.5决策树的股票数据挖掘[J]. 王领,胡扬. 计算机与现代化. 2015(10)
[9]基于粒子群算法的决策树SVM多分类方法研究[J]. 王道明,鲁昌华,蒋薇薇,肖明霞,李必然. 电子测量与仪器学报. 2015(04)
[10]基于代价敏感的AdaBoost算法改进[J]. 王学玲,王建林. 计算机应用与软件. 2013(10)
硕士论文
[1]一种新的不平衡数据处理方法在股票分类中的应用[D]. 张雨晴.北京交通大学 2018
[2]基于实时数据流处理的http数据分析可视化系统[D]. 潘冬.电子科技大学 2016
本文编号:3282026
本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/3282026.html