当前位置:主页 > 经济论文 > 股票论文 >

金融新闻中的关联实体挖掘研究

发布时间:2020-06-13 02:09
【摘要】:金融市场是一个资本和生产要素的配置场所,是一个国家的政治、经济、文化信息的集散地,金融市场吸引着媒体和大量人民群众的关注。媒体每天不断的发布大量金融市场的新闻,人们通过媒体发布的新闻密切的关注着金融市场,同时新闻也会影响人们对金融资产标的看法,新闻对金融市场会产生影响已经是人们公认的事情。从海量的新闻中挖掘有用的信息,定位这些新闻对金融资产标的影响,对于金融市场的运作、社会资本的配置都至关重要。过去学者研究股票市场都基于一个假设,就是已知受新闻影响的股票实体。但是由于这个假设,这些方法不可避免的忽视了不含股票实体的新闻,而很多不含股票实体的新闻同样会对金融市场产生重大的影响。本文针对金融新闻中非特定关联实体挖掘的问题,构建了基于新闻主题抽取的新闻实体图,并构建了多源异构的金融知识图谱,提出了基于语义路径的子图匹配算法,通过匹配新闻实体图与金融知识图谱,最终识别出金融新闻所对应的关联实体集合,从语义的层面匹配出受到影响的股票实体,从而可以全面分析各种包含或者不包含金融实体的新闻。本文的主要研究工作及成果概况如下。本文以结构化数据为起点,半结构化数据和非结构化数据为补充,通过知识抽取、实体消歧、知识存储等步骤,构建了多源异构的股票市场知识图谱,涵盖了大部分股票市场的实体。本文通过主题模型分析,从金融新闻中抽取相关性最高的主题,利用这些主题构建了新闻图,并提出了基于语义路径的子图匹配算法,从知识图谱中寻找和新闻图相匹配的子图,所匹配的子图顶点就是和金融新闻相关联的实体集合。本文根据子图匹配的结果,设计实验,第一个实验对比了本文算法和SVM、决策树、全连接网络、朴素贝叶斯以及RCNN分类方法的分类性能,实验结果显示本文算法相比其他对比方法有着更好的综合性能。第二个实验模拟真实投资策略进行回测,在新闻发生的第二天买入受影响的股票并在持有一天后卖出,本文的算法在相同时间段的收益超过对比方法,同时本文算法相对大盘取得了28.82%超额收益。实验验证了基于语义路径的子图匹配算法的有效性,同时证明了算法在实际投资中的可行性。
【图文】:

示意图,论文研究,框架,知识图


图 1-1 论文研究框架示意图1.3.1 多源异构的金融知识图谱构建证券市场关系错综复杂,国内上市公司之间有着千丝万缕的联系,如果能清晰的表达出这种关系,,对于研究股票价格的变动是有着巨大的帮助的。为了刻画股票实体之间的关系,本文将构建股票间关系的知识图谱。知识图谱根本上是一种基于图的语义网络,其由节点和边组成。在知识图谱中,真实物理世界中存在的实体由图中顶点表示,实体和实体之间的关系则由知识图谱中的边表示,知识图谱的基本组成单位是“实体-关系-实体”三元组,以及实体及其相关“属性-值”对。知识图谱就是把所有不同类别的知识收集在一起连接而得到的一个关系网络。知识图谱可以使我们从关系的维度去分析并解决问题。自顶向下和自底向上是知识图谱常用的构建方法。其中自顶向下的方法是指首先为知识图谱定义数据模式和本体模式,在构建本体的过程中,开始从最顶层的模式构建,然后逐渐进行细化,建立结构良好的分类学层系结构;再将实体和关系添加到构建好的数据模式中。自底向上的方式则恰好相反,首先从

金融新闻中的关联实体挖掘研究


图2-1双层LSTM-RNN[34]
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:F832.51;TP391.1

【参考文献】

相关期刊论文 前3条

1 黄玮强;庄新田;姚爽;;我国股票关联网络拓扑结构与网络弹性关系研究[J];系统管理学报;2015年01期

2 饶育蕾;王攀;;媒体关注度对新股表现的影响——来自中国股票市场的证据[J];财务与金融;2010年03期

3 亢升;郑方辉;;网络媒体市场影响力评价的路径和方法探讨——以国内四大中文门户网站为例[J];华南理工大学学报(社会科学版);2007年06期

相关博士学位论文 前1条

1 胡芳槐;基于多种数据源的中文知识图谱构建方法研究[D];华东理工大学;2015年

相关硕士学位论文 前1条

1 赵茜倩;互联网财经新闻对中国股市的影响研究[D];西南财经大学;2012年



本文编号:2710468

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/2710468.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户706d0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com