基于互联网金融异构信息挖掘的热点发现与追踪
发布时间:2017-07-31 18:35
本文关键词:基于互联网金融异构信息挖掘的热点发现与追踪
更多相关文章: 热点发现 热点追踪 排名聚合算法 时间序列预测 排名学习
【摘要】:近年来,沪深A股市场上涌现出了许多热点概念,例如2015年上半年期间,“国企改革”、“互联网金融”、“一带一路”、“沪港通”等概念相继成为热点并频繁出现。相关个股在某一概念、热点背景下,往往在短期内有较好的市场表现。如何抓住这种市场上的热点、概念带来的投资机会,是量化研究领域非常关心的问题。本课题围绕A股市场热点发现这一问题,从互联网海量金融数据中挖掘出当前市场的热点个股以及相关板块,追踪市场热点的发展过程,并向投资者提供有价值的市场信息。本课题研究的主要内容如下:互联网金融异构信息获取及预处理:主要分为三大类信息,第一类是A股实时行情数据,主要包括A股市场股票的每日价格涨跌和成交量;第二类是A股财务信息及板块分类;第三类是个股舆情数据,主要包括新闻数据和股吧数据。获取这些数据后,通过进一步去噪,优化,提炼等处理,将原始的非结构化的金融数据处理为结构化数据,为后续系统的构建提供准确的数据保障。基于排名聚合算法的热点发现:本文把市场热点发现问题转化为排名聚合问题,从市场的热度信息中挖掘热度指标,将热度指标转化为热度排名,并采用排名聚合方法将众多的热度排名转化为综合热度排名,从热度排名信息中发现市场热点。本文主要研究了一类基于无监督的排名聚合算法,并从行情、股吧、新闻三个维度进行热度计算,搭建了一套完善且有效的热点发现模块。基于时间序列预测方法的热点追踪:完成热点发现模块后,从热度时间序列信息出发,研究市场上的热点变化规律。根据历史热度序列去预测未来热度序列正是时间序列预测所研究的内容。本文主要研究了时间序列预测方法和排名学习方法在热点追踪问题中的应用。综上所述,本文使用数据挖掘技术从海量金融数据中挖掘当前市场正在炒作的热点个股以及相关板块,追踪市场热点的发展过程,并向投资者提供有价值的市场信息。
【关键词】:热点发现 热点追踪 排名聚合算法 时间序列预测 排名学习
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:F724.6;F832
【目录】:
- 摘要4-5
- Abstract5-9
- 第1章 绪论9-15
- 1.1 课题背景及意义9-10
- 1.2 国内外研究现状10-13
- 1.2.1 排名聚合算法研究现状10-11
- 1.2.2 时间序列预测方法研究现状11-12
- 1.2.3 排名学习方法研究现状12-13
- 1.3 本文主要研究内容及章节安排13-15
- 第2章 互联网金融异构信息获取及预处理15-21
- 2.1 引言15
- 2.2 金融异构信息获取15-19
- 2.2.1 实时行情数据15-16
- 2.2.2 财务信息及板块分类16-18
- 2.2.3 个股舆情数据18-19
- 2.3 金融异构信息预处理19
- 2.3.1 行情数据的预处理19
- 2.3.2 新闻和股吧数据的预处理19
- 2.4 本章小结19-21
- 第3章 基于排名聚合算法的金融热点发现21-28
- 3.1 基于无监督学习的排名聚合算法21-23
- 3.1.1 朴素的线性加权策略21-22
- 3.1.2 基于随机梯度下降的排名聚合方法22-23
- 3.2 个股热度计算方法23-26
- 3.2.1 行情热度计算25-26
- 3.2.2 新闻和股吧热度计算26
- 3.3 板块热度计算方法26-27
- 3.4 本章小结27-28
- 第4章 基于预测模型的金融热点追踪28-43
- 4.1 热点追踪问题背景介绍28-29
- 4.2 基于时间序列预测方法的热点追踪29-34
- 4.2.1 移动平均法和指数平滑法29-30
- 4.2.2 最小二乘学习法30-32
- 4.2.3 基于时间序列的金融热点预测模型32-34
- 4.3 基于排名学习方法的热点追踪34-39
- 4.3.1 排名学习方法34-36
- 4.3.2 基于排名学习的支持向量机方法36-38
- 4.3.3 基于Pair Wise LTR的金融热点排序模型38-39
- 4.4 金融热点演化规律39-42
- 4.5 本章小结42-43
- 第5章 实验平台与知识服务的实现43-51
- 5.1 实验环境与实验数据43
- 5.2 实验结果评估与分析43-48
- 5.2.1 基于时间序列的金融热点预测实验分析43-45
- 5.2.2 基于Pair Wise LTR的金融热点排序实验分析45-48
- 5.3 热点发现与追踪知识服务平台的实现48-50
- 5.4 本章小结50-51
- 结论51-52
- 参考文献52-57
- 附录57-67
- 附录A57-59
- 附录B59-67
- 致谢67
【相似文献】
中国硕士学位论文全文数据库 前1条
1 蔡文举;基于互联网金融异构信息挖掘的热点发现与追踪[D];哈尔滨工业大学;2015年
,本文编号:600536
本文链接:https://www.wllwen.com/guanlilunwen/huobilw/600536.html