当前位置:主页 > 科技论文 > 数学论文 >

特征降维算法在股价预测中的应用研究

发布时间:2022-02-19 03:00
  随着信息时代的到来,数据的获取更加便捷,不论是在维度上或样本数目上都呈现爆炸性的增长。各大行业利用互联网快速便捷的优势不断地吸收、获取、交换着数据信息,这些数据信息能够帮助人们从不同的角度、不同方式详细地描述和理解事物,但同时也出现维度过高、信息冗余、计算困难等问题,这些问题反而容易导致对信息描述的不准确。虽然高维大量的样本数据能带给我们更多更丰富的信息,但是如何把握信息中关键的内容,如何处理和摒弃掉冗余的信息仍然是需要广泛深入研究的问题,现今已有一种处理方式即是对高维数据进行降维处理。无论是线性或是非线性的降维方法都已多种多样,其中运用较为广泛的一种方法是主成分分析(PCA)算法,它的优异之处在于无特定限制的参数以及算法简洁明了,但其本身是一种无监督的特征提取算法,不能充分考虑到标签带来的先验信息。其次是算法提取主元个数的关键步骤缺乏客观性,过多或过少的主元信息都容易使得模型精度降低,且前人对此的研究也较少。针对上述所提到的问题,本文主要研究工作如下:(1)考虑到很多研究在利用PCA算法进行降维之前未考虑特征与标签之间的关联性,即标签的先验信息,本文提出在PCA进行降维前,利用互信息... 

【文章来源】:华南理工大学广东省211工程院校985工程院校教育部直属院校

【文章页数】:74 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 研究背景和研究意义
    1.2 国内外研究现状
        1.2.1 特征选择研究综述
        1.2.2 股价预测模型综述
        1.2.3 问题总结
    1.3 本文研究目标及主要内容
        1.3.1 研究对象及目标
        1.3.2 主要内容及创新点
        1.3.3 本文结构安排
第二章 线性与非线性降维技术原理
    2.1 线性降维算法
        2.1.1 线性判别分析算法
        2.1.2 局部保持投影算法
        2.1.3 主成分分析算法
    2.2 非线性降维算法
        2.2.1 核主成分分析算法
        2.2.2 多维尺度分析算法
        2.2.3 局部线性嵌入算法
        2.2.4 随机分布嵌入算法及其改进
第三章 特征降维分类框架
    3.1 特征降维分类概述
    3.2 特征选择算法
        3.2.1 过滤式(Filter)
        3.2.2 封装式(Wrapper)
        3.2.3 嵌入式(Embedding)
    3.3 特征提取算法
        3.3.1 线性特征提取算法
        3.3.2 非线性特征提取算法
第四章 MI-IPCA降维算法
    4.1 熵和互信息
        4.1.1 信息熵、联合熵和条件熵
        4.1.2 互信息
    4.2 主成分分析具体算法步骤
    4.3 基于MI-IPCA的双重特征选择算法
        4.3.1 复相关系数
        4.3.2 改进的PCA算法
        4.3.3 互信息和改进的PCA融合的特征选择算法(MI-IPCA)
第五章 MI-IPCA算法在股价预测中的实证研究
    5.1 样本数据的选取和预处理
        5.1.1 样本数据的选取
        5.1.2 数据预处理
    5.2 基于互信息的初步特征筛选
    5.3 基于改进的PCA算法的特征提取结果
    5.4 基于BP神经网络的实证预测研究
        5.4.1 BP神经网络概述
        5.4.2 激活函数及网络参数
        5.4.3 BP网络算法流程
        5.4.4 模型评价标准
        5.4.5 主元数选取模型的预测
        5.4.6 MI-IPCA与 IPCA降维后预测结果比较
总结与展望
参考文献
攻读硕士学位期间取得的研究成果
致谢
附件


【参考文献】:
期刊论文
[1]基于PCA与t-SNE特征降维的城市植被SVM识别方法[J]. 于慧伶,霍镜宇,张怡卓,蒋毅.  实验室研究与探索. 2019(12)
[2]主成分分析和线性判别分析应用于心电信号特征提取和诊断算法研究[J]. 李鸿强,魏小清,王有玺,张振,宫正,吴非凡.  生物医学工程研究. 2019(02)
[3]基于特征选择和SVM的电信客户离网预测[J]. 卢光跃,张宏建,闫真光,吴洋.  西安邮电大学学报. 2019(02)
[4]基于DMD-LSTM模型的股票价格时间序列预测研究[J]. 史建楠,邹俊忠,张见,汪春梅,卫作臣.  计算机应用研究. 2020(03)
[5]基于特征选择和神经网络的铁路货运量预测[J]. 段力,王开鹏,刘聪健,王孙超.  物流技术. 2018(09)
[6]基于特征选取与LSTM模型的股指预测方法研究[J]. 陈佳,刘冬雪,武大硕.  计算机工程与应用. 2019(06)
[7]基于正则化LSTM模型的股票指数预测[J]. 任君,王建华,王传美,王建祥.  计算机应用与软件. 2018(04)
[8]基于BPNN和SVR的股票价格预测研究[J]. 冉杨帆,蒋洪迅.  山西大学学报(自然科学版). 2018(01)
[9]基于时间序列的GA-BP神经网络股价预测模型[J]. 薛倩男,高岳林.  兰州文理学院学报(自然科学版). 2017(05)
[10]基于改进t-SNE算法的人体运动数据关键帧提取[J]. 马吉,刘瑞,张建霞.  计算机工程. 2016(05)

博士论文
[1]面向高维数据的特征学习算法研究[D]. 王海雷.中国科学技术大学 2019
[2]基于人工神经网络的化学发光法及光度法在多组分同时测定中的应用研究[D]. 申金山.四川大学 2005

硕士论文
[1]工业监测数据降维及应用[D]. 张永艳.西安理工大学 2019
[2]变分自编码器结合t分布随机邻域嵌入降维及聚类分析[D]. 郭韵颖.大连理工大学 2019
[3]基于PCA-GA-BPNN模型对股价预测的研究[D]. 李海燕.西安理工大学 2018
[4]基于卷积神经网络的沪深300指数预测[D]. 陈祥一.北京邮电大学 2018
[5]基于主成分分析和BP神经网络的股价预测[D]. 刘庆霞.苏州大学 2017
[6]高维数据降维处理关键技术研究[D]. 李蝉娟.电子科技大学 2017
[7]基于改进的SVM和t-SNE高速列车走行部故障诊断[D]. 张雨晨.西南交通大学 2016
[8]改进的卷积神经网络在金融预测中的应用研究[D]. 张贵勇.郑州大学 2016
[9]基于LSTM神经网络的美股股指价格趋势预测模型的研究[D]. 孙瑞奇.首都经济贸易大学 2016
[10]降维算法的改进与应用[D]. 贾洪哲.辽宁师范大学 2014



本文编号:3632077

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3632077.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ccc25***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com