当前位置:主页 > 科技论文 > 软件论文 >

股市舆情数据的挖掘与分析研究

发布时间:2022-10-18 19:41
  随着计算机科技的高速发展与网络数据信息的激增,数据挖据技术已经逐步成为信息时代下推动金融股票市场创新发展的核心力量。在股票市场中越来越多的股民投资者热衷于在网络论坛中交流股市投资心得,由此产生的非结构化股评舆情数据成为了影响股票市场健康发展的重要因素。在有关网络舆情数据与股票市场关系的各类研究中,传统的股市交易指标已经无法满足投资者把握股票市场运行规律的需求。本文基于机器学习和深度学习技术对股市舆情数据进行了挖掘与分析,力求解决股市舆情潜藏情感倾向挖掘能力不足以及相关交易指标预测结果不佳的问题,相关研究工作如下:1.使用爬虫抓取器,按照特定规则遍历解析东方财富网股吧网页评论信息及其它特定属性列表信息作为股市舆情数据源。借助多个处理工具对原始数据进行去噪声、去干扰以及分词、停用词过滤等预处理工作,在中文分词和特征矩阵构建的结构化过程中引入TF-IDF加权技术和Word2vec表达技术实现非结构文本的量化表示,以提高后续分类预测模型的输入质量与学习效果。2.以挖掘股市舆情数据的情感倾向作为研究目标,基于朴素贝叶斯和卷积神经网络两种思想构建股评舆情数据情感倾向分类器,根据分类器评测指标对比分... 

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
第1章 绪论
    1.1 课题研究背景及意义
    1.2 国内外研究现状
        1.2.1 基于舆情数据的情感分析研究现状
        1.2.2 舆情数据情感倾向分类的研究现状
        1.2.3 基于舆情数据的预测类研究现状
    1.3 主要研究内容
    1.4 组织结构安排
第2章 相关理论知识
    2.1 机器学习模型
        2.1.1 朴素贝叶斯
        2.1.2 支持向量回归机
    2.2 深度学习模型
        2.2.1 卷积神经网络
        2.2.2 BP神经网络
    2.3 评测指标
        2.3.1 分类评测指标
        2.3.2 预测评价指标
    2.4 本章小结
第3章 数据采集与规范化处理
    3.1 数据样本采集
        3.1.1 股评数据获取
        3.1.2 情感词典语料设定
    3.2 舆情文本预处理
        3.2.1 股评除噪
        3.2.2 文本分词
    3.3 数据结构化表示
        3.3.1 文本量化
        3.3.2 特征矩阵构建
        3.3.3 词嵌入表达
    3.4 本章小结
第4章 基于股市舆情数据的情感倾向分类研究
    4.1 朴素贝叶斯情感倾向分类
    4.2 卷积神经网络情感倾向分类
        4.2.1 Word2Vec训练
        4.2.2 相似度求解
        4.2.3 CNN分类
    4.3 实验结果分析与讨论
        4.3.1 Naive Bayes样本训练结果
        4.3.2 CNN参数配置结果
        4.3.3 情感分类结果对比与分析
    4.4 本章小结
第5章 舆情数据对股市相关指标的预测研究
    5.1 股评舆情情感值对成交量的预测
        5.1.1 情感值计算
        5.1.2 情感值预测
    5.2 支持向量回归机模型预测股市收益率
        5.2.1 支持向量回归机构建
        5.2.2 支持向量回归机预测
    5.3 BP神经网络预测股市收益率
        5.3.1 BP神经网络模型构建
        5.3.2 BP预测
    5.4 结果对比与分析
    5.5 本章小结
总结与展望
参考文献
致谢
附录A 攻读硕士期间所发表的论文


【参考文献】:
期刊论文
[1]改进朴素贝叶斯算法在文本分类中的应用[J]. 黄勇,罗文辉,张瑞舒.  科技创新与应用. 2019(05)
[2]基于深度学习支持向量机的上证指数预测[J]. 张晶华,甘宇健.  统计与决策. 2019(02)
[3]基于支持向量机模型的地铁进站客流量预测[J]. 郭文,肖为周,秦菲菲.  河北工业科技. 2019(01)
[4]面向大规模中文文本分类的朴素贝叶斯并行Spark算法(英文)[J]. 刘鹏,赵慧含,滕家雨,仰彦妍,刘亚峰,朱宗卫.  Journal of Central South University. 2019(01)
[5]大数据背景下机器学习在数据挖掘中的应用[J]. 王旸.  信息与电脑(理论版). 2018(21)
[6]卷积神经网络下的Twitter文本情感分析[J]. 王煜涵,张春云,赵宝林,袭肖明,耿蕾蕾,崔超然.  数据采集与处理. 2018(05)
[7]用于情感分类的双向深度LSTM[J]. 曾蒸,李莉,陈晶.  计算机科学. 2018(08)
[8]Network-based naive Bayes model for social network[J]. Danyang Huang,Guoyu Guan,Jing Zhou,Hansheng Wang.  Science China(Mathematics). 2018(04)
[9]Influence Analysis of Emotional Behaviors and User Relationships Based on Twitter Data[J]. Kiichi Tago,Qun Jin.  Tsinghua Science and Technology. 2018(01)
[10]基于灰色GARCH模型和BP神经网络的股票价格预测[J]. 曹晓,孙红兵.  软件. 2017(11)

硕士论文
[1]基于BP算法的钢结构建筑工业化建造施工质量评价体系研究[D]. 郑海涛.沈阳建筑大学 2015



本文编号:3692933

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3692933.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户612c5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com