基于Hadoop的金融事件的分析与计算
发布时间:2021-01-08 21:36
事件研究是金融行业的专有名词。事件研究通过检验企业股票价格在事件宣布前后的反应,来衡量事件发生(如企业合并、发布收益公告等)对企业估值的影响。目前事件研究的方法论比较成熟,但是并未走向实际应用。主要是由于以下原因:1.事件分析:目前的事件采集主要是人工采集,然而面对越来越多的上市公司,越来越多的公司公告,人工采集不能及时获得事件。本文基于Hadoop平台和NLP技术,在自动获取事件方面做了一些有意义的尝试。2.事件研究的分布式计算:目前事件研究多是对于一个企业某个事件做事件研究,然后将结果用于其他企业的同类事件的异常收益计算上。本文基于Hadoop平台的分布式计算能力,对于历史上同类事件综合计算其事件研究的结果。将这样的结果应用于未来发生事件的异常收益预计,具有更高的准确性。本文的主要工作内容包括:(1)简化对文本数据的管理。基于ETL工具Morphline实现了公告数据解析、导入到分布式全文索引服务器SolrCloud的整个数据加工过程。最终,索引和文件信息则是存放在分布式文件系统HDFS之上。(2)将传统的事件研究法的模型求解转换为多元线性回归问题,进而通过调用Spark MLli...
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图2-1作业提交的执行过程??8??
图2-2?MapReduce的计算过程??Hadoop分布式文件系统(HDFS)是Hadoop项目中的文件存储系统组件
?Mesos?Standalone??图2-3?Spark基本架构??2.1.3?Solr全文搜索服务器与分布式部署??Solr是基于Apache?Lucene构建的全文搜索服务器。Solr于2004年由CNET??Networks公司启动研究项目。随后,公司进行项目开源,并作为Apache项目被??研究至今。Solr是基于Lucene核心索引库实现的。该库使用Java开发,创建文??档的倒排索引。??Solr具有高度可扩展和容错的特性,支持全文搜索以及富文档(如PDF)的??处理,提供近实时索引。为保证其可靠性,具备自动故障转移和恢复的能力等[|7】。??S〇lr具有类似REST的API,提供标准的开放接口。Solr可以通过HTTP、XML、??CSV、二进制文件和JSON存入文档,也可以通过HTTP的GET查询请求接收??结果并解析,具有高度的可扩展性。同时,Soli?内置了响应式用户管理界面,??通过界面可以实时监测Solr的运行情况
【参考文献】:
期刊论文
[1]上市公司董事长变更对盈余质量的影响——一项基于事件研究法的经验证据[J]. 刘亭立. 科学决策. 2009(02)
[2]中文事件抽取技术研究[J]. 赵妍妍,秦兵,车万翔,刘挺. 中文信息学报. 2008(01)
[3]上市公司信息披露管理办法[J]. 中国证券监督管理委员会公告. 2007(01)
[4]事件研究方法及其在金融经济研究中的应用[J]. 袁显平,柯大钢. 统计研究. 2006(10)
[5]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才. 通信学报. 2006(02)
[6]“事件研究法”在并购重组中的运用[J]. 林世雄. 中山大学学报论丛. 2005(06)
[7]基于N-最短路径方法的中文词语粗分模型[J]. 张华平,刘群. 中文信息学报. 2002(05)
本文编号:2965341
【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校
【文章页数】:82 页
【学位级别】:硕士
【部分图文】:
图2-1作业提交的执行过程??8??
图2-2?MapReduce的计算过程??Hadoop分布式文件系统(HDFS)是Hadoop项目中的文件存储系统组件
?Mesos?Standalone??图2-3?Spark基本架构??2.1.3?Solr全文搜索服务器与分布式部署??Solr是基于Apache?Lucene构建的全文搜索服务器。Solr于2004年由CNET??Networks公司启动研究项目。随后,公司进行项目开源,并作为Apache项目被??研究至今。Solr是基于Lucene核心索引库实现的。该库使用Java开发,创建文??档的倒排索引。??Solr具有高度可扩展和容错的特性,支持全文搜索以及富文档(如PDF)的??处理,提供近实时索引。为保证其可靠性,具备自动故障转移和恢复的能力等[|7】。??S〇lr具有类似REST的API,提供标准的开放接口。Solr可以通过HTTP、XML、??CSV、二进制文件和JSON存入文档,也可以通过HTTP的GET查询请求接收??结果并解析,具有高度的可扩展性。同时,Soli?内置了响应式用户管理界面,??通过界面可以实时监测Solr的运行情况
【参考文献】:
期刊论文
[1]上市公司董事长变更对盈余质量的影响——一项基于事件研究法的经验证据[J]. 刘亭立. 科学决策. 2009(02)
[2]中文事件抽取技术研究[J]. 赵妍妍,秦兵,车万翔,刘挺. 中文信息学报. 2008(01)
[3]上市公司信息披露管理办法[J]. 中国证券监督管理委员会公告. 2007(01)
[4]事件研究方法及其在金融经济研究中的应用[J]. 袁显平,柯大钢. 统计研究. 2006(10)
[5]基于层叠隐马尔可夫模型的中文命名实体识别[J]. 俞鸿魁,张华平,刘群,吕学强,施水才. 通信学报. 2006(02)
[6]“事件研究法”在并购重组中的运用[J]. 林世雄. 中山大学学报论丛. 2005(06)
[7]基于N-最短路径方法的中文词语粗分模型[J]. 张华平,刘群. 中文信息学报. 2002(05)
本文编号:2965341
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2965341.html