当前位置:主页 > 科技论文 > 软件论文 >

基于深度神经网络的端到端语篇解析

发布时间:2018-07-31 21:04
【摘要】:语篇关系是指两个文本单元之间的语义逻辑关系,如因果关系、转折关系等。语篇解析以自由文本为输入,返回文本中蕴含的语篇关系。语篇解析可以广泛应用于许多自然语言处理任务,如问答系统、统计机器翻译和自动文摘等。以往的研究工作多集中在语篇解析的各个子任务,如语篇连接词识别、论元标记、显性或隐性语篇关系语义识别等。本文的第一个工作是构建一个精心设计的英文语篇解析器,在Lin等[7]的语篇解析器基础上,提出并设计更多有效特征和组件,这一系统在2015年的CoNLL英文语篇解析竞赛中获得第一名。为进一步构造面向实用的显性语篇解析器,本文分别对两个论元抽取不同特征,构建不同的分类器,显著提升性能,这一部分工作在2015年的KSEM(CCF-C类)会议上获得"最佳论文奖"。由于缺乏中文标注语料,中文语篇关系的相关研究很少。随着CDTB语料库的发布,本文的第二个工作是深入分析中英文的不同特点,构建一个有效的中文语篇解析器,这一系统在2016年CoNLL的中文语篇解析竞赛中获得第二名。隐性语篇解析是整个语篇解析的瓶颈,以往采用语言学特征结合机器学习的方法,需要专家领域知识,系统泛化性差。随着深度学习在自然语言处理领域的深入发展,本文的第三个工作首先提出使用卷积神经网络进行隐性语篇关系的语义识别,该系统在2016年CoNLL的英文语篇解析竞赛中获得第二名。进而,本文又提出基于关注机制的神经网络来提升隐性语篇关系语义识别性能。深度学习需要大量的训练样本,为了解决人工标注数据量的局限性,本文的第四个工作提出多任务的神经网络模型,利用大量人工合成的隐性语篇关系数据,进一步提升识别性能。第三和第四个工作目前已投稿2017年的EMNLP会议。本文在中文和英文语篇解析上,进行了大量的实验。实验结果表明,本文提出的端到端英文和中文语篇解析的有效性,进而采用基于关注机制和多任务的深度神经网络模型,能够帮助提升中英文隐性语篇关系的语义识别性能。
[Abstract]:Textual relations refer to the semantic logical relationships between two text units, such as causality, transition, etc. Text parsing takes the free text as input and returns the textual relationship contained in the text. Discourse parsing can be widely used in many natural language processing tasks, such as question-answering systems, statistical machine translation and automatic abstracts. Previous studies have focused on the subtasks of discourse parsing, such as textual conjunction recognition, argument meta-marker, explicit or implicit textual relation semantic recognition, and so on. The first work of this paper is to construct a carefully designed English text parser, which proposes and designs more effective features and components on the basis of Lin et al. [7]. This system won the first place in the CoNLL English discourse Analysis Competition in 2015. In order to construct a pragmatic explicit discourse parser, this paper extracts different features from two arguments, constructs different classifiers, and improves performance significantly. This part of the work won the "best paper award" at the KSEM (CCF-C class) conference in 2015. Due to the lack of Chinese tagging data, there is little research on the relationship between Chinese texts. With the release of the CDTB corpus, the second work of this thesis is to analyze the different features of Chinese and English, and construct an effective Chinese text parser, which is the second place in the 2016 CoNLL Chinese discourse parsing contest. Implicit discourse parsing is the bottleneck of the whole text parsing. In the past, the method of combining linguistic features with machine learning requires expert domain knowledge, and the system generalization is poor. With the development of deep learning in the field of natural language processing, the third work of this paper first proposes the use of convolutional neural networks for semantic recognition of recessive discourse relations. The system won the second place in the 2016 CoNLL English discourse Analysis contest. Furthermore, this paper proposes a neural network based on attention mechanism to improve the semantic recognition performance of recessive discourse relations. In order to solve the limitation of artificial tagging data, the fourth work of this paper proposes a multi-task neural network model, which uses a large number of artificial synthetic recessive text relational data. Further improve the recognition performance. The third and fourth jobs are currently contributing to the 2017 EMNLP meeting. In this paper, a large number of experiments have been carried out in Chinese and English discourse analysis. The experimental results show that the proposed end-to-end English and Chinese discourse parsing is effective, and the depth neural network model based on attention mechanism and multitasking can help to improve the semantic recognition performance of implicit discourse relations in both Chinese and English.
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1;TP18

【相似文献】

相关期刊论文 前10条

1 杨晓帅 ,付玫;神经网络技术让管理更轻松[J];软件世界;2000年11期

2 云中客;新的神经网络来自于仿生学[J];物理;2001年10期

3 唐春明,高协平;进化神经网络的研究进展[J];系统工程与电子技术;2001年10期

4 李智;一种基于神经网络的煤炭调运优化方法[J];长沙铁道学院学报;2003年02期

5 程科,王士同,杨静宇;新型模糊形态神经网络及其应用研究[J];计算机工程与应用;2004年21期

6 王凡,孟立凡;关于使用神经网络推定操作者疲劳的研究[J];人类工效学;2004年03期

7 周丽晖;从统计角度看神经网络[J];统计教育;2005年06期

8 赵奇 ,刘开第 ,庞彦军;灰色补偿神经网络及其应用研究[J];微计算机信息;2005年14期

9 袁婷;;神经网络在股票市场预测中的应用[J];软件导刊;2006年05期

10 尚晋;杨有;;从神经网络的过去谈科学发展观[J];重庆三峡学院学报;2006年03期

相关会议论文 前10条

1 徐春玉;;基于泛集的神经网络的混沌性[A];1996中国控制与决策学术年会论文集[C];1996年

2 周树德;王岩;孙增圻;孙富春;;量子神经网络[A];2003年中国智能自动化会议论文集(上册)[C];2003年

3 罗山;张琳;范文新;;基于神经网络和简单规划的识别融合算法[A];2009系统仿真技术及其应用学术会议论文集[C];2009年

4 郭爱克;马尽文;丁康;;序言(二)[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

5 钟义信;;知识论:神经网络的新机遇——纪念中国神经网络10周年[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

6 许进;保铮;;神经网络与图论[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

7 金龙;朱诗武;赵成志;陈宁;;数值预报产品的神经网络释用预报应用[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年

8 田金亭;;神经网络在中学生创造力评估中的应用[A];第十二届全国心理学学术大会论文摘要集[C];2009年

9 唐墨;王科俊;;自发展神经网络的混沌特性研究[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年

10 张广远;万强;曹海源;田方涛;;基于遗传算法优化神经网络的故障诊断方法研究[A];第十二届全国设备故障诊断学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 美国明尼苏达大学社会学博士 密西西比州立大学国家战略规划与分析研究中心资深助理研究员 陈心想;维护好创新的“神经网络硬件”[N];中国教师报;2014年

2 卢业忠;脑控电脑 惊世骇俗[N];计算机世界;2001年

3 葛一鸣 路边文;人工神经网络将大显身手[N];中国纺织报;2003年

4 中国科技大学计算机系 邢方亮;神经网络挑战人类大脑[N];计算机世界;2003年

5 记者 孙刚;“神经网络”:打开复杂工艺“黑箱”[N];解放日报;2007年

6 本报记者 刘霞;美用DNA制造出首个人造神经网络[N];科技日报;2011年

7 健康时报特约记者  张献怀;干细胞移植:修复受损的神经网络[N];健康时报;2006年

8 刘力;我半导体神经网络技术及应用研究达国际先进水平[N];中国电子报;2001年

9 ;神经网络和模糊逻辑[N];世界金属导报;2002年

10 邹丽梅 陈耀群;江苏科大神经网络应用研究通过鉴定[N];中国船舶报;2006年

相关博士学位论文 前10条

1 杨旭华;神经网络及其在控制中的应用研究[D];浙江大学;2004年

2 李素芳;基于神经网络的无线通信算法研究[D];山东大学;2015年

3 石艳超;忆阻神经网络的混沌性及几类时滞神经网络的同步研究[D];电子科技大学;2014年

4 王新迎;基于随机映射神经网络的多元时间序列预测方法研究[D];大连理工大学;2015年

5 付爱民;极速学习机的训练残差、稳定性及泛化能力研究[D];中国农业大学;2015年

6 李辉;基于粒计算的神经网络及集成方法研究[D];中国矿业大学;2015年

7 王卫苹;复杂网络几类同步控制策略研究及稳定性分析[D];北京邮电大学;2015年

8 张海军;基于云计算的神经网络并行实现及其学习方法研究[D];华南理工大学;2015年

9 李艳晴;风速时间序列预测算法研究[D];北京科技大学;2016年

10 陈辉;多维超精密定位系统建模与控制关键技术研究[D];东南大学;2015年

相关硕士学位论文 前10条

1 章颖;混合不确定性模块化神经网络与高校效益预测的研究[D];华南理工大学;2015年

2 贾文静;基于改进型神经网络的风力发电系统预测及控制研究[D];燕山大学;2015年

3 李慧芳;基于忆阻器的涡卷混沌系统及其电路仿真[D];西南大学;2015年

4 陈彦至;神经网络降维算法研究与应用[D];华南理工大学;2015年

5 董哲康;基于忆阻器的组合电路及神经网络研究[D];西南大学;2015年

6 武创举;基于神经网络的遥感图像分类研究[D];昆明理工大学;2015年

7 李志杰;基于神经网络的上证指数预测研究[D];华南理工大学;2015年

8 陈少吉;基于神经网络血压预测研究与系统实现[D];华南理工大学;2015年

9 张韬;几类时滞神经网络稳定性分析[D];渤海大学;2015年

10 邵雪莹;几类时滞不确定神经网络的稳定性分析[D];渤海大学;2015年



本文编号:2156821

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2156821.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户62bde***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com