基于网络舆情的量化选股策略实证研究
发布时间:2021-10-13 09:27
互联网时代,股市投资者获取金融市场信息、进行股票交易和交流等活动几乎都是通过互联网进行的。其中,股吧、论坛等网络平台聚集了大量个人投资者和机构投资者,他们会在这些网络平台发表对股市或者某只股票走势的看法,也会相互评论进行交流。行为金融学认为,人的决策行为是不理性的、且容易受到所处环境的影响,这也为股市投资研究提供了新的视角:通过研究股吧、论坛等网络平台的舆情来探究其对股市、投资的影响。本文使用机器学习中的支持向量机算法(SVM)构建基于网络舆情的量化选股模型,对网络舆情因子指标是否对量化选股模型的选股能力有影响来展开研究。首先,利用网络爬虫对2017年8月至2018年8月沪深300成分股的在线股评文本进行采集,对采集的股评文本进行情感分析后,计算出网络舆情因子值。然后,将网络舆情因子与通过有效性因子检验的7个基本面因子和技术面因子相结合,使用前3个月因子数据优化多因子量化选股模型的参数,并使用后9个月的因子数据进行回测,对比加入与未加入网络舆情因子的量化选股模型回测结果显示:(1)在回测期间,基于网络舆情的量化选股模型获得了8.07%的超额收益(基准为沪深300指数),而同期未加入网络...
【文章来源】:西南民族大学四川省
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 导论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国外文献
1.2.2 国内文献
1.2.3 文献评述
1.3 研究思路、内容及方法
1.3.1 研究思路
1.3.2 研究内容
1.3.3 研究方法
1.4 本文创新点及不足之处
第2章 相关理论与技术基础
2.1 量化投资概述
2.2 机器学习
2.2.1 机器学习概念
2.2.2 支持向量机
2.3 网络爬虫
2.4 文本情感分析
2.4.1 文本表示模型
2.4.2 文本特征选择
2.4.3 文本特征权重
2.4.4 文本分类算法
2.5 本章小结
第3章 网络舆情因子的建立
3.1 股评文本数据采集
3.2 股评文本数据预处理
3.2.1 人工标注
3.2.2 中文分词
3.2.3 特征选择
3.2.4 股评的文本表示
3.3 构建网络舆情因子
3.3.1 建立情感分类模型
3.3.2 计算网络舆情因子值
3.4 本章小结
第4章 多因子量化选股策略实证分析
4.1 候选因子选取及预处理
4.1.1 候选因子选取
4.1.2 因子值的预处理
4.2 因子有效性的检验
4.3 多因子量化选股模型的构建
4.3.1 SVM算法参数优化
4.3.2 多因子量化选股模型的建立
4.4 基于网络舆情因子的量化选股模型建立
4.5 本章小结
第5章 结论与展望
5.1 结论
5.2 对未来的展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于Python的新浪微博数据爬虫[J]. 周中华,张惠然,谢江. 计算机应用. 2014(11)
[2]在线文本情感分析技术及应用[J]. 乐国安,董颖红,陈浩,赖凯声. 心理科学进展. 2013(10)
[3]基于MACD指标的智能选股系统设计与开发[J]. 张静,黄东军. 企业技术开发. 2010(07)
硕士论文
[1]基于SVM算法的多因子选股模型实证研究[D]. 周渐.浙江工商大学 2017
[2]基于XGBoost算法的多因子量化选股方案策划[D]. 李想.上海师范大学 2017
[3]网络舆情分析关键技术研究[D]. 刘泽光.东北大学 2013
[4]基于多因子量化模型的A股投资组合选股分析[D]. 江方敏.西南交通大学 2013
[5]基于估值与业绩的选股策略有效性研究[D]. 汪洋.电子科技大学 2010
[6]股票价格分析[D]. 袁捷.西南交通大学 2009
本文编号:3434392
【文章来源】:西南民族大学四川省
【文章页数】:66 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 导论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 文献综述
1.2.1 国外文献
1.2.2 国内文献
1.2.3 文献评述
1.3 研究思路、内容及方法
1.3.1 研究思路
1.3.2 研究内容
1.3.3 研究方法
1.4 本文创新点及不足之处
第2章 相关理论与技术基础
2.1 量化投资概述
2.2 机器学习
2.2.1 机器学习概念
2.2.2 支持向量机
2.3 网络爬虫
2.4 文本情感分析
2.4.1 文本表示模型
2.4.2 文本特征选择
2.4.3 文本特征权重
2.4.4 文本分类算法
2.5 本章小结
第3章 网络舆情因子的建立
3.1 股评文本数据采集
3.2 股评文本数据预处理
3.2.1 人工标注
3.2.2 中文分词
3.2.3 特征选择
3.2.4 股评的文本表示
3.3 构建网络舆情因子
3.3.1 建立情感分类模型
3.3.2 计算网络舆情因子值
3.4 本章小结
第4章 多因子量化选股策略实证分析
4.1 候选因子选取及预处理
4.1.1 候选因子选取
4.1.2 因子值的预处理
4.2 因子有效性的检验
4.3 多因子量化选股模型的构建
4.3.1 SVM算法参数优化
4.3.2 多因子量化选股模型的建立
4.4 基于网络舆情因子的量化选股模型建立
4.5 本章小结
第5章 结论与展望
5.1 结论
5.2 对未来的展望
参考文献
致谢
【参考文献】:
期刊论文
[1]基于Python的新浪微博数据爬虫[J]. 周中华,张惠然,谢江. 计算机应用. 2014(11)
[2]在线文本情感分析技术及应用[J]. 乐国安,董颖红,陈浩,赖凯声. 心理科学进展. 2013(10)
[3]基于MACD指标的智能选股系统设计与开发[J]. 张静,黄东军. 企业技术开发. 2010(07)
硕士论文
[1]基于SVM算法的多因子选股模型实证研究[D]. 周渐.浙江工商大学 2017
[2]基于XGBoost算法的多因子量化选股方案策划[D]. 李想.上海师范大学 2017
[3]网络舆情分析关键技术研究[D]. 刘泽光.东北大学 2013
[4]基于多因子量化模型的A股投资组合选股分析[D]. 江方敏.西南交通大学 2013
[5]基于估值与业绩的选股策略有效性研究[D]. 汪洋.电子科技大学 2010
[6]股票价格分析[D]. 袁捷.西南交通大学 2009
本文编号:3434392
本文链接:https://www.wllwen.com/jingjilunwen/hongguanjingjilunwen/3434392.html