当前位置:主页 > 科技论文 > 软件论文 >

基于开放数据的领域知识图谱构建及应用

发布时间:2020-04-20 18:27
【摘要】:领域知识图谱中的领域实体和领域实体关系,可以作为领域知识引入众多的应用场景中。通过代码生成相关技术,生成领域应用平台上可以执行的代码,使得开发者能够基于现有领域平台更加快速地完成领域相关服务或应用的开发。领域知识图谱中的领域知识可以应用于领域平台上的代码生成的过程中,但基于领域知识图谱的领域相关代码生成存在一些问题。第一,领域知识图谱的构建,需要更多领域相关的数据源;对于来自于多个数据源的数据,需要进行数据融合以解决数据的异构性。第二,人工构建领域知识图谱的方法非常耗时,并且更新和维护都非常困难。作为构建领域知识图谱的核心工作,需要实现领域实体以及领域实体关系的自动抽取,从而实现领域知识图谱的自动构建。第三,代码生成过程中,需求描述的文本表述方式和平台相关转换关系的不完整性,需要引入领域知识以实现对需求描述中领域术语以及业务逻辑的解析和转换。本论文使用开放数据中的领域相关数据,抽取领域实体和领域实体关系,构建领域知识图谱。基于构建的领域知识图谱,实现领域目标系统代码的生成。本论文的工作主要包括如下的几个方面:(1)提出了一种异构开放数据的融合方法。对不同数据文档中的数据项信息进行融合。选取开放数据中包含领域实体的领域相关文档作为数据源,基于数据项信息和数据文档可信度的关联性,计算数据文档中候选领域实体的可信度评分,实现从领域相关开放数据中抽取领域实体。(2)提出了一种领域知识图谱的构建方法。本论文中使用开放数据中领域相关的数据,通过领域实体抽取和领域实体间关系抽取,实现多个来源领域知识数据的融合。以抽取出的领域实体集合为基础,结合领域相关代码生成过程中引入领域知识的应用,抽取领域实体的属性关系、同义关系以及领域实体间的多元关系,实现应用于领域相关代码生成的领域知识图谱的构建。(3)提出了一种基于领域知识图谱的领域相关代码生成方法。本论文中基于构建的应用于量化交易的领域知识图谱,实现策略描述文本到策略逻辑模型的转换。之后结合平台相关的转换对应关系,转化为目标回测平台的平台相关策略模型。最终使用代码模板和模板引擎实现生成量化交易回测平台可以执行的策略代码。(4)构建了应用于量化交易回测系统的代码生成系统。根据本论文中提出的方法框架,使用财务分析领域相关开放数据,构建了应用于量化交易的知识图谱。以量化交易回测平台的代码生成为背景,阐明了方法的有效性。本论文中使用领域知识图谱作为领域知识引入领域相关代码生成的过程中,消除了用户的需求描述和目标平台代码之间存在的障碍,降低了用户领域相关应用平台的使用门槛。同时通过对业务逻辑更加抽象的描述取代遵循特定平台规则的编码,也可以方便地实现代码在领域不同应用平台间的移植。
【图文】:

交易模型,开发量,投资者,股息率


分析本论文中提出的基于开放数据的领域相关代码生成方法的应用场景。投资者开发量化交易模型的一般过程如图2-1 所示。投资者从分析师的研究报告或者根据投资分析相关理论,可以得出可能对金融产品价格产生影响的因素。例如对于根据股票一年的总派息额和当前股价计算出的股息率来说,通常认为具有更高股息率的公司的生产经营情况更好,有更高的可能相比同行业的其他公司取得更高的收益率,即具有更高股息率的上市公司有更大的可能取得相比同行业其他上市公司的超额收益。则上市公司股票的股息率就可以作为投资者构建量化交易模型的一个因子,一个直观的量化交易策略即购买股息率高的上市公司的股票。当投资者确定量化交易策略之后,需要对选定的量化交易策略中的诸如调仓频率、参考指标的具体范围等进行限定与量化,从而形成量化交易策略模型。例如对于上述提到的购买股息率高的上市公司的股票这一量化交易策略来说,我们可以限定调仓频率是每年一次、每季度一次乃至每天根据当时公布的分红预案计算出的股息率对持仓的股票进行调整;对于股息率高的定义我们可以将其定义为所有上市公司股息率从高到低排名的前 10%或者前 20%。每季度选择当前股息率最高的前 10%的股票就是通过对调仓频率和参考指标的范围进行限定之后,对于购买股息率高的上市公司的股票的量化交易策略构建的一种量化交易模型。

流程图,回测,用户使用,平台


图 2-2 用户使用量化交易回测平台的流程图Fig.2-2 Flow diagram for users to use quantitative trading backtesting platform但不同平台对于用户编写的量化交易策略的代码有不同的限定,并且不同平台对于不同类型的量化交易策略的支持也不完全。投资者对于开发不同类型的量化交易策略,,可能需要学习多个第三方平台策略代码编写的规则。而对于不具备编程能力的投资者来说,将量化交易策略模型转化为可以在量化交易回测平台上执行的回测代码存在着很大的障碍。在上述提到的投资者利用第三方平台进行量化交易模型开发的应用场景中,本论文的研究是解决投资者量化交易策略到量化交易回测平台上可以执行的回测代码之间的障碍,通过构建的应用于量化交易领域的知识图谱,通过对策略中领域相关术语的识别,以及对策略逻辑的建模,从而实现策略代码的生成。目前在各个应用领域中有很多平台,对该领域的相关数据或者领域相关的一些底层服务进行封装,开发者可以在平台上通过配置或者编写代码调用平台提供的数据或服务,实现该领域具体的业务逻辑提供相应服务给最终用户使用,这些平台的存在简化了开发者领域相关服务的开发过程。但不同的平台提供的功能往
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.1;TP311.52

【相似文献】

相关期刊论文 前10条

1 宋文;张士男;;专业领域知识环境建设的理念与实践[J];图书馆理论与实践;2012年01期

2 宋文;刘毅;黄金霞;刘峥;;院所协同机制下的专业领域知识环境建设[J];图书情报工作;2010年14期

3 裴利芳,朱新明,林仲贤;领域知识与自我解释策略间关系的实验研究[J];心理学报;1997年04期

4 闵罗礼;张铨;;控制领域知识的分类和表达[J];黑龙江自动化技术与应用;1988年04期

5 张广梅,孟祥文;软件原型开发中领域知识的研究[J];山东矿业学院学报;1998年03期

6 张发亮;刘君杰;周沫;;领域知识结构基础理论及构建研究[J];情报杂志;2018年02期

7 阮磊;;浅谈电子技术学科知识的解构与学习领域知识的重构[J];科技信息;2012年27期

8 徐戎;王文杰;周四新;;神经网络与领域知识结合的纳税评估预警模型[J];电子科技大学学报;2009年01期

9 孙江山;;基于学科领域知识的虚拟现实实验系统的设计与实现[J];电化教育研究;2012年08期

10 郭卫宁;;国内图书情报学领域知识服务研究脉络探析[J];图书馆学研究;2016年04期

相关会议论文 前10条

1 蔡笑岳;张维;;要义提示对不同学科领域知识水平学生错误记忆的影响[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年

2 蔡笑岳;何伯锋;;知识学习的结构表征与学科建构——学科领域知识学习及其认知机制[A];第十五届全国心理学学术会议论文摘要集[C];2012年

3 孙沛;;ID2的领域知识表示探讨[A];计算机与教育:迎接21世纪教育信息化的挑战——全国计算机辅助教育学会第九届学术年会[C];1999年

4 缪建明;吴晨;郝惠宁;张全;;一种基于HNC理论的领域知识表示研究[A];第三届学生计算语言学研讨会论文集[C];2006年

5 汤朝霞;蔡笑岳;;初中数学问题解决中学科领域知识对元认知监控的影响[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

6 王挺;庞维国;王振宏;;多领域知识并行启动对创新思维的影响[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

7 潘海为;韩启龙;印桂生;张炜;李建中;;基于领域知识指导的医学图像关联规则挖掘[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

8 张德政;刘洁卉;;基于图分析的领域知识获取技术[A];着力提高高等教育质量,努力增强高校创新与服务能力——北京市高等教育学会2007年学术年会论文集(上册)[C];2008年

9 赵燕;蔡笑岳;;学科领域知识和学业水平对工作记忆广度的影响[A];增强心理学服务社会的意识和功能——中国心理学会成立90周年纪念大会暨第十四届全国心理学学术会议论文摘要集[C];2011年

10 苏静;蔡笑岳;;工作记忆与领域知识在个体认知行为中的作用[A];中国心理学会发展心理学专业委员会、中国心理学会教育心理学专业委员会二00六年度学术年会论文摘要集[C];2006年

相关重要报纸文章 前10条

1 受访人 华东理工大学出版社 陈艺方 王一佼 藕园 黄娜 采访人 中国出版传媒商报记者 孙珏;垂直领域知识付费产品怎么做透?[N];中国出版传媒商报;2019年

2 记者 蒋建科;电商领域知识产权保护专项整治开展[N];人民日报;2018年

3 内蒙古呼伦贝尔边防支队政委 李天勇;立起“六个标杆” 当好官兵表率[N];中国边防警察报;2016年

4 江苏经济报记者 杜颖梅 通讯员 张锋;长三角联手为电商领域知识产权添装“安全锁”[N];江苏经济报;2017年

5 记者 孙迪;我国首部装备建设领域知识产权管理国家军用标准实施[N];中国知识产权报;2017年

6 记者 方晓静 黄官国;交流生产技术经验 增进科技领域知识[N];中国食品质量报;2005年

7 本报记者 阎密;切实保护电商领域知识产权[N];国际商报;2015年

8 特约记者 卢冬虎;上海表彰商业领域知识产权保护先进企业[N];医药经济报;2009年

9 傅爱平;数字化应用系统中的领域知识[N];中国社会科学院院报;2006年

10 蔡笑岳 何伯锋 广州大学青少年心理发展与教育研究所;广州医学院卫生管理学院心理学系;知识学习的学科建构与结构表征[N];中国社会科学报;2012年

相关博士学位论文 前10条

1 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年

2 李卫;领域知识的获取[D];北京邮电大学;2008年

3 李华;基于本体的应急领域知识表示与复用研究[D];天津大学;2008年

4 郝心宁;生物育种领域知识结构与知识演化研究[D];中国农业科学院;2013年

5 张晶;面向数据挖掘的关系型领域知识融合方法研究[D];合肥工业大学;2016年

6 张金宝;物理学科领域知识的类别学习研究[D];天津师范大学;2015年

7 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年

8 鹿文鹏;基于依存和领域知识的词义消歧方法研究[D];北京理工大学;2014年

9 王丽苹;融合领域知识的心电图分类方法研究[D];华东师范大学;2013年

10 欧阳鑫;基于本体导向的关联分析方法研究[D];昆明理工大学;2013年

相关硕士学位论文 前10条

1 毕舰水;基于开放数据的领域知识图谱构建及应用[D];上海交通大学;2018年

2 周志威;融合领域知识的关联规则知识发现研究[D];郑州大学;2019年

3 叶帅;基于Neo4j的煤矿领域知识图谱构建及查询方法研究[D];中国矿业大学;2019年

4 安宁;基于网络结构演化的领域知识涌现与传承研究[D];东北师范大学;2019年

5 张娜娜;基于领域知识的航空密封标准管理系统开发[D];西安工业大学;2018年

6 何韵林;不同学业水平的高中生物理学科领域知识的表征研究[D];西南大学;2018年

7 李昱昕;特定领域知识图谱的自动构建方法研究[D];哈尔滨工业大学;2018年

8 苏菁;基于领域知识图谱的网络信息可信度测度[D];江苏科技大学;2018年

9 孙丹;数字板书对学生学科领域知识学习的影响研究[D];浙江师范大学;2017年

10 卢海洋;物理学科领域知识教学对学业水平的影响研究[D];上海师范大学;2018年



本文编号:2634826

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2634826.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3adb0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com