文本挖掘选股与资产组合建模及其分散化研究
发布时间:2017-09-24 12:39
本文关键词:文本挖掘选股与资产组合建模及其分散化研究
更多相关文章: 文本挖掘 文本情绪 资产组合理论 行为金融学 分散化
【摘要】:文本挖掘是一项综合性的课题,涉及数学、统计学、计算机科学等众多技术,是用来应对信息爆炸的有力武器。互联网上的信息汗牛充栋,其中不乏有用的知识,但无关的噪音更多,人力早已无从甄别,只有在现代计算机的性能飞跃发展的基础上,使用分布式计算(Distributed Computation)如Hadoop、Map-Reduce等技术处理大数据。本文回顾了资产组合理论的起源与发展,及其在资本市场的深远影响和广泛运用,同时建立在这块基石上的传统金融学理论现今也受到越来越多的市场异象的挑战,所以一些学者借鉴了很多社会科学、行为学、心理学的理论成果,对市场异象给出了解释,发展了行为资产组合理论。在前人研究的基础上,我们证明了文本挖掘系统实施的可行性。本文致力于利用计算机技术分析金融文本的情绪,搭建了文本挖掘系统,针对门户网站的财经新闻及雪球发贴,使用网络爬虫抓取文本,使用分布式计算和大规模支持向量机(LSSVM)对文本进行分类;设计了股票关注度、情绪量化指标,对这些金融文本数据进行量化分析;将该指标纳入传统价值选股模型,建立了文本挖掘选股模型。我们创新性地建立了中文文本挖掘系统,首先对投资社交平台一雪球网的金融文本数据进行了挖掘。我们创新性地设计了文本挖掘选股因子买入卖出信号,并验证了该信号的有效性。对于传统选股模型与文本挖掘选股模型,我们创新性地用有效赌注数来评判模型的优劣,即对比二者的风险分散化水平。通过对比我们发现,在传统选股模型中加入文本挖掘选股因子,能提供一个有别于公司基本面、股价量价关系等指标的全新视角,有效增加选股模型的风险分散化水平,资产组合预期能获得更为稳定的低风险收益。文本挖掘模型的有效性,也从旁佐证了投资行为偏差的存在,通过对这些偏差的识别,能增加选股模型获得超额收益的可能性。通过本文的研究,我们加深了对现代资产组合理论的理解,对行为金融学的发展、文本挖掘技术的运用进行了非常有益的探讨。
【关键词】:文本挖掘 文本情绪 资产组合理论 行为金融学 分散化
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F830.91;TP391.1
【目录】:
- 摘要5-7
- Abstract7-11
- 第一章 绪论11-19
- 1.1 研究背景11-17
- 1.1.1 现代资产组合理论的起源与发展12-13
- 1.1.2 现代资产组合理论在资本市场的运用13-16
- 1.1.3 现代资产组合理论存在的问题16-17
- 1.2 研究思路及创新点17
- 1.3 研究内容及研究框架17-19
- 第二章 文献综述19-30
- 2.1 行为金融学19-21
- 2.2 文本挖掘理论21-28
- 2.2.1 信息源22-24
- 2.2.2 内容分析的方法24-27
- 2.2.3 衡量文本情绪27-28
- 2.3 分散化理论28-29
- 2.4 本章小结29-30
- 第三章 文本挖掘系统30-40
- 3.1 文本挖掘系统实施方案30-36
- 3.1.1 数据来源30-32
- 3.1.2 文本挖掘系统架构32-36
- 3.2 文本挖掘选股因子36-40
- 3.2.1 热点题材挖掘36
- 3.2.2 关注度指标36-37
- 3.2.3 情绪指标37-38
- 3.2.4 文本挖掘选股因子构建38-40
- 第四章 数据分析与实证研究40-55
- 4.1 “国企改革”样本股统计性描述40-43
- 4.2 文本挖掘选股因子43-45
- 4.3 投资组合构建45-48
- 4.3.1 基准投资组合45-47
- 4.3.2 文本挖掘投资组合47-48
- 4.4 投资组合有效前沿对比48-49
- 4.5 投资组合分散化水平分析49-55
- 4.5.1 有效赌注数49-50
- 4.5.2 主成分赌注50-51
- 4.5.3 最小扭转赌注51-52
- 4.5.4 投资组合分散化水平分析52-55
- 第五章 结论与展望55-56
- 参考文献56-60
- 致谢60-61
【参考文献】
中国期刊全文数据库 前2条
1 吴世农,韦绍永;上海股市投资组合规模和风险关系的实证研究[J];经济研究;1998年04期
2 谌志群;张国煊;;文本挖掘与中文文本挖掘模型研究[J];情报科学;2007年07期
,本文编号:911465
本文链接:https://www.wllwen.com/jingjilunwen/zbyz/911465.html