当前位置:主页 > 文艺论文 > 语言艺术论文 >

基于依存句法分析的企业税法实体关系抽取方法研究

发布时间:2020-03-26 04:26
【摘要】:随着人工智能技术的不断发展,人机对话系统的构建成了研究领域里的一大热点,人机对话的实现离不开计算机对于文本信息(以下简称“文本”)的处理和理解,从现有的研究来看,计算机对于文本的理解还不够智能化。计算机要实现对文本的智能化处理,需要同时对句法和语义进行分析,遇到歧义时,还要结合上下文的语境进行处理,本文的研究亦是基于上述原则展开的。本文研究重点在于命名实体识别和实体关系抽取,为了取得较好的结果,需要将语法规则和语义分析结合在一起。命名实体的识别,通过知识图谱进行总结和梳理,以一种可视化的形式展现出来,同时在最大程度上确保了命名实体的全面性,方便及时查漏补缺。实体关系抽取,要从语法和语义两个方面入手,为了获取较好的语法规则,本文选用了依存句法对其进行分析。该种方法可以用来处理长难句和歧义句,且可以更好地展现出句子的核心和层次性。同时,实体关系的抽取离不开实体关系词的语义映射,这就需要对实体关系进行语义上的分类,而不单单只停留在语法层面。有了语法层面的规则分析以及语义层面的实体关系分类,就可以更好地理解一句话的真实意图,从而达到对于文本信息的处理和识别。本文研究的领域为企业税法,因此研究的目标则为公司税法领域内所涉及到的相关命名实体以及实体关系,本文参考了六本该领域的专业书籍,同时通过百度词条、百度问答、知乎等平台来搜寻企业所涉及的相关税法,对其中所涉及到的命名实体进行总结、划分和归类。在构建实体关系体系时,针对每一种实体关系,也建立了一个与之相对应的词表。使用“Mind Manager(思维导图)-幕布”作为工具,生成该领域中所涉及到的命名实体及实体间关系,然后以图形的方式将它们表现出来。同时,抽取其中所涉及到的命名实体关系,抽取主要是对句法规则进行总结,对新增的句子进行解析,得出相应的分词,在经过分词、词性标注以及句法分析等步骤后,每个句子都会有一个相对应的句法树,每个句法树都可以用相对应的标签来表示。本文选择企业税法领域作为研究对象,与其重要性是密不可分的。税收来源于民众,而服务于民众。无论是从国家或是政府的财政收入还是社会的经济发展状况来看,税收都起到了举足轻重的作用。而税收的依据就是税法,基于此,笔者认为研究企业税法的社会价值十分重要。同时,现阶段,整个社会进入了一个全民创业期。对于创业者来说,他们急需学习相关的企业税法知识,而本文所做的有关于“企业税法”方面的研究将为他们提供一个了解该领域知识的平台。此外,本文在企业税法实体关系抽取研究的基础上,结合当前的研究热点,将研究内容与自动问答系统结合在一起,使得研究结果能够运用到实践中,也让该研究具有了更多的实际价值。综上所述,本文利用依存句法分析技术和语义分类,将其应用于企业税法领域中,试图实现自动抽取命名实体和实体关系的目的,并以此为基础,提出了一套构建该领域的自动问答系统的构想,希望借助该研究,将其运用到实际的自动问答系统之中。
【图文】:

树库,多视图,中文,北京大学


图 1.1 中文树库信息汇总本文是以北京大学的多视图依存树库(Peking University Multi-view Chineebank, PMT)为依托,对语料进行处理时所使用的是依存句法结构,该种语构中,,只有一个中心核心,其他成分皆依附在该核心之上,即便有些成分不

句法树,示例,对语,详细地


依存句法树示例
【学位授予单位】:鲁东大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:H14

【相似文献】

相关期刊论文 前10条

1 李真;张优敏;夏冬梅;靳冲;;基于句法分析的实体关系抽取[J];科技风;2018年15期

2 刘绍毓;李弼程;郭志刚;王波;陈刚;;实体关系抽取研究综述[J];信息工程大学学报;2016年05期

3 郭喜跃;何婷婷;胡小华;陈前军;;基于句法语义特征的中文实体关系抽取[J];中文信息学报;2014年06期

4 周舜哲;;基于句法语义特征的中文实体关系抽取[J];北方文学;2016年20期

5 朱姗;;基于规则和本体的实体关系抽取系统研究[J];情报杂志;2010年S2期

6 李煜甫;黄蔚;胡国超;;弱监督军事实体关系识别[J];电子设计工程;2018年01期

7 朱艳辉;李飞;胡骏飞;钱继胜;王天吉;;基于三支决策的两阶段实体关系抽取研究[J];计算机工程与应用;2018年09期

8 武文雅;陈钰枫;徐金安;张玉洁;;中文实体关系抽取研究综述[J];计算机与现代化;2018年08期

9 周利娟;林鸿飞;罗文华;;基于实体关系的犯罪网络识别机制[J];计算机应用研究;2011年03期

10 董丽丽;高山;张翔;;集成学习算法在实体关系抽取中的应用[J];西安建筑科技大学学报(自然科学版);2011年03期

相关会议论文 前9条

1 车万翔;刘挺;李生;;实体关系自动抽取[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

2 庄成龙;钱龙华;周国栋;;基于树核函数的实体关系抽取方法研究[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 徐芬;王挺;陈火旺;;基于SVM方法的中文实体关系抽取[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

4 张苇如;孙乐;韩先培;;基于维基百科和模式聚类的实体关系抽取方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

5 王浩畅;赵铁军;于浩;;基于文本的生物信息获取[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

6 甘甜;莫倩;张华平;;基于搜索引擎的人物社会关系抽取研究[A];第五届全国信息检索学术会议论文集[C];2009年

7 姚天f ;;一种用于汉语信息抽取的词汇本体[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

8 王智坚;李水平;包洋;李金娟;张莨;;烟叶交售排队系统的设计与分析[A];中国烟草学会2016年度优秀论文汇编—— 信息化管理主题[C];2016年

9 石志强;李涛;孙延涛;;基于以太网的宽带社区网络管理系统[A];2003年通信软件技术学术年会论文集[C];2003年

相关重要报纸文章 前1条

1 著名律师 高树;程序合法决定结果合法[N];深圳特区报;2012年

相关博士学位论文 前10条

1 郑巍;基于文本挖掘的生物医学实体关系抽取研究[D];大连理工大学;2018年

2 张晓峰;基于核方法的实体关系抽取研究[D];东南大学;2016年

3 赵哲焕;生物医学实体关系抽取研究[D];大连理工大学;2017年

4 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年

5 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年

6 郭喜跃;面向开放领域文本的实体关系抽取[D];华中师范大学;2016年

7 顾静航;面向生物医学领域的实体关系抽取研究[D];苏州大学;2017年

8 张宏涛;面向生物文本的实体关系自动抽取问题研究[D];清华大学;2012年

9 陈忱;面向Web的实体关系查询与分析关键技术研究[D];东北大学;2013年

10 甘丽新;基于句法和语义分析的中文实体关系抽取[D];江西财经大学;2017年

相关硕士学位论文 前10条

1 陈秋瑞;基于特征向量与核函数相结合的高新技术词汇关系抽取模型研究[D];华中师范大学;2019年

2 蒋贻顺;基于规则匹配与神经网络学习的中文实体关系抽取研究[D];合肥工业大学;2019年

3 王春宇;基于深度学习的生物医学实体关系抽取方法研究[D];吉林大学;2019年

4 江爽;基于依存句法分析的皮肤病实体关系抽取[D];鲁东大学;2019年

5 何龙;基于依存句法分析的企业税法实体关系抽取方法研究[D];鲁东大学;2019年

6 刘亚军;中文命名实体及实体关系的自动抽取研究[D];郑州大学;2019年

7 佘恒;基于深度学习的中文文本实体关系抽取研究与实现[D];北京邮电大学;2019年

8 温政;基于深度学习的实体关系抽取研究[D];太原理工大学;2019年

9 高赛;面向党建领域实体关系抽取技术的研究[D];中国科学院大学(中国科学院沈阳计算技术研究所);2019年

10 吴海涛;基于语义要素的网络社区文本实体关系图谱构建[D];北京邮电大学;2019年



本文编号:2600942

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/yuyanyishu/2600942.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户75260***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com