基于文本分析和数据挖掘的股市分析系统
发布时间:2023-11-04 10:36
在传统的股票交易软件中,用户仅仅可以获得实时市场行情数据以及独立于各个股票之间的关于股票股评信息。用户很难从这些信息中发现当前市场的热点,这些信息也难以和用户在股票交易过程中考虑的股票的新闻、公告等文本数据相关联。同时,这种传统的分析股票的方式基本是以股票之间无关联的思维方式进行分析的。然而,A股市场的股票之间并不是孤立的,在涨跌变化时,股票间的涨跌行为多表现出了一定的关联性。并且这些群体的涨跌行为多和股票行情外部的文本信息有着极大的关联性。本系统的目的就是通过数据挖掘等技术对股票关联性进行分析,找到股票之间的关联关系,进而结合股票之间的关联关系和市场行情数据对A股市场进行更加详尽的分析。同时利用文本分析技术将新闻、公告等文本数据和分析结果进行进一步对应。协助用户找到涨跌的原因。本系统主要基于数据挖据中相似性计算,关联分析,聚类技术和自然语言处理中文本摘要,文本生成等技术。本系统为了解决股票之间孤立的问题,首先提出了标签的概念,为股票进行细粒度,层次化的划分。然后,分别建立股票,标签之间的关联关系。并且以股票,标签之间的关联关系为基础,结合市场行情数据,用多影响因素的思路,以整体性和关...
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 研究现状
1.2.1 基于股市基本数据的股市分析
1.2.2 利用股市文本分析技术的股市分析
1.2.3 联合基本数据和文本数据的股市分析
1.2.4 研究现状分析
1.3 本文的主要研究内容
1.4 本文的主要组织结构
第2章 标签及股票的关系计算和行情数据挖掘
2.1 标签的定义及获取
2.2 基于股票集合的标签关系计算
2.2.1 标签的消歧算法
2.2.2 基于股票集合的标签关系计算
2.3 基于词向量的标签关系计算
2.4 股票关系的计算
2.5 股票历史行情数据的挖掘
2.6 本章工作评价
2.7 本章小结
第3章 基于标签组合的股市分析
3.1 热门标签组合选择算法
3.2 热门标签选择算法
3.3 分析算法评价
3.3.1 基于股市特征和热门标签推荐股票
3.3.2 对照实验模型介绍
3.3.3 实验设置
3.3.4 实验结果
3.4 本章小结
第4章 股票新闻多文档摘要及分析描述生成
4.1 股票多文档摘要任务定义
4.2 新闻文本表示及多文档摘要
4.2.1 多文档摘要句子排序算法
4.2.2 句子表示和相似度计算
4.3 股票多文档摘要的评价
4.3.1 实验设置
4.3.2 实验结果
4.4 股市分析结果描述生成
4.4.1 描述数据的收集
4.4.2 数据的分析
4.4.3 文本规划和模板设计
4.5 生成描述实例及分析
4.6 本章小结
第5章 股市分析系统设计与实现
5.1 总体架构和交互逻辑
5.1.1 系统总体架构
5.1.2 系统和用户的交互逻辑
5.2 整体的系统展示
5.2.1 股票标签基本数据的存储
5.2.2 热门标签组合的展示
5.2.3 热门标签的展示
5.2.4 文档摘要及短文本的展示
5.2.5 股票热度强度展示
5.3 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其他成果
致谢
本文编号:3860135
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第1章 绪论
1.1 课题背景及研究的目的和意义
1.2 研究现状
1.2.1 基于股市基本数据的股市分析
1.2.2 利用股市文本分析技术的股市分析
1.2.3 联合基本数据和文本数据的股市分析
1.2.4 研究现状分析
1.3 本文的主要研究内容
1.4 本文的主要组织结构
第2章 标签及股票的关系计算和行情数据挖掘
2.1 标签的定义及获取
2.2 基于股票集合的标签关系计算
2.2.1 标签的消歧算法
2.2.2 基于股票集合的标签关系计算
2.3 基于词向量的标签关系计算
2.4 股票关系的计算
2.5 股票历史行情数据的挖掘
2.6 本章工作评价
2.7 本章小结
第3章 基于标签组合的股市分析
3.1 热门标签组合选择算法
3.2 热门标签选择算法
3.3 分析算法评价
3.3.1 基于股市特征和热门标签推荐股票
3.3.2 对照实验模型介绍
3.3.3 实验设置
3.3.4 实验结果
3.4 本章小结
第4章 股票新闻多文档摘要及分析描述生成
4.1 股票多文档摘要任务定义
4.2 新闻文本表示及多文档摘要
4.2.1 多文档摘要句子排序算法
4.2.2 句子表示和相似度计算
4.3 股票多文档摘要的评价
4.3.1 实验设置
4.3.2 实验结果
4.4 股市分析结果描述生成
4.4.1 描述数据的收集
4.4.2 数据的分析
4.4.3 文本规划和模板设计
4.5 生成描述实例及分析
4.6 本章小结
第5章 股市分析系统设计与实现
5.1 总体架构和交互逻辑
5.1.1 系统总体架构
5.1.2 系统和用户的交互逻辑
5.2 整体的系统展示
5.2.1 股票标签基本数据的存储
5.2.2 热门标签组合的展示
5.2.3 热门标签的展示
5.2.4 文档摘要及短文本的展示
5.2.5 股票热度强度展示
5.3 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其他成果
致谢
本文编号:3860135
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3860135.html