当前位置:主页 > 教育论文 > 对外汉语论文 >

基于事件链的语篇连贯研究

发布时间:2018-03-11 08:34

  本文选题:篇章连贯 切入点:词汇链 出处:《武汉大学》2013年博士论文 论文类型:学位论文


【摘要】:语篇连贯无论在语言教学还是信息处理中都有着非常重要的作用。语篇连贯一直以来也是篇章语言学的研究热点之一。有关篇章连贯的理论也层出不穷,异彩纷呈。其中比较有代表性的理论有韩礼德和哈桑提出的衔接加语域理论,VanDijk的宏观结构理论,Mann和Thompson的修辞结构理论,Danes和Fries提出的主位推进理论,以及Grosz et al的中心理论。从计算机可操作性的角度审视这些理论,可以发现这些理论所揭示的篇章连贯的模型可以归结为三类:基于关系的表示模型,基于逻辑的表示模型和基于实体的表示模型。这些模型在计算可操作性方面存在一些问题:要么现有的计算机技术无法满足模型的实现,要么模型本身的语言学假设过于松弛。基于此,我们提出基于事件链的语篇连贯理论及模型,以增强基于实体的语篇连贯模型的语言学假设,同时利用现有较成熟的句子和事件分析技术,为语篇连贯的判定和应用提供一条新的途径。连贯的篇章中存在指向中心话题的事件,这些事件按照一定的关系相互关联构成事件链。事件链建立在词汇链的基础上,在一定程度上保证了其计算的可操作性。 全文分为八章,主要内容和观点如下: 第一章:研究引论。引论分为六个小节,具体内容包括语篇连贯研究背景、语篇连贯国内外研究现状及分析、语篇连贯研究存在的问题、本文研究内容和研究对象、研究方法、本文结构。 第二章:语篇连贯理论。本章简要介绍语篇连贯的主导性理论以及分析这些理论的计算机可操作性。 第三章:事件理论。本章主要从理论层面讨论事件和事件链用于分析和判断语篇连贯的可行性。事件在不同领域有不同的定义。我们采用哲学和语言学对事件的定义,即事件是动词表达的概念。事件按照其动词所具有的时间结构而产生了相应的事件结构。传统的事件研究只是局限在句法的基础上,没有上升到篇章的层面。在此基础上,我们认为动词的语义辐射不仅仅局限于句子内部,它可以超越名子层面而进入语段和语篇层面。这种超越句子而进入语段和语篇层面的事件结构分析我们称之为事件链,事件链的存在影响着语篇的连贯程度。同时,事件的良构性使得事件能够广泛应用于自然语言处理的各个领域,这为事件链用于分析篇章连贯提供了技术保障。篇章语义结构呈现一个层级结构:处于最上层的是宏观语义结构,第二层是篇章的微观语义结构,第三层是实体关系层,最底层是词汇语义层。宏观语义结构通过微观语义单元一事件和事件之间的关系来表示。事件和事件关系的体现是建立在实体关系和词汇语义的基础上。事件类型按照动词的功能分为六类:动作型事件、关系型事件、感知型事件、生理型事件、陈述型事件和存在型事件。每类事件的语义角色探讨,事件与句子之间的关系,事件关系类型。本文提出的事件关系类型包括十一种关系类型:并列、顺承、解说、选择、递进、转折、条件、假设、因果、目的、共指。 第四章:事件链模型。本章主要从计算模型的角度讨论事件链模型如何构建篇章连贯。结合汉语篇章实例,提出事件和事件链的描写机制。对于事件的描写,我们采用通常的谓词论元结构;对于事件链的描写,则主要赴描写事件间的相互关系。 第五章:事件链构建。篇章中事件链的构建从词汇链开始。构建词汇链后,根据临近原则,查找词汇链上的谓词及诩词携带的论元,形成篇章基本构成单元一事件。这些事件按照一定的关系构成事件链。具体包括以下内容:第一节探讨汉语篇章的词汇链构建。第二节探讨事件链构建,分为事件识别和事件关系识别。第三节讨论事件链计算方法。第四节讨论事件链评估策略。第五节总结本章内容。 第六章:事件链资源建设。本章分为四个小节,主要讨论如何从事件和事件链的角度来构建语篇连贯资源。具体内容为,第一节阐述建靠语篇连贯资源的目的和意义,概述了目前存在的中英文语篇连贯相关资源的特点。其中,英文语篇连贯资源包括宾州语篇树库(Penn Discourse Treebank)、修辞结构树库(Rhetorical Structure Treebank)、语篇连贯图库(Discourse GraphBank),中文语篇连贯资源包括中文命题库(Chinese PropBank),中文语篇树库(Chinese Discourse Treebank),汉语财经评论的修辞结构标注语料库等。这些资源建设选取篇章连贯的角度不同,其标注方法也各有千秋,为后续基于事件和事件链的汉语语篇连贯资源建设奠定了基础。第二节阐述如何从事件和事件链的角度构建汉语语篇连贯资源,具体内容包括语料的选择、标注标准的确定、标注质量控制、标注效率和标注平台的搭建。我们选取宾州中文树库的新闻语料作为标注的对象,制定了详细的词汇链、事件、事件链和事件关系标注标准,并根据事件和事件链标注的特点搭建起标注平台。第三节标注前期成果展示。第四节就构建基于事件和事件链的汉语篇章连贯资源过程中出现的问题进行讨论。第五节归纳总结基于事件链的汉语篇章连贯资源建设并提出展望。 第七章:事件链应用。本章主要就事件链的应用展开讨论。事件链可以应用在对外汉语教学和语言信息处理两个方面。具体到章节的分配上,第一节选取汉语教学中的写作环节来讨论事件链的应用;第二节选取自然语言处理中的自动摘要生成来讨论事件链的应用;第三节总结事件链的应用及其意义。 第八章:结论。 本文主要创新点在于以下四个方面: 第一,从理论研究层面来看,把语篇连贯这个传统语言学中的复杂问题形式化为一个可计算的分析问题,并将之用在作文评判和句子排序中。 第二,从表示机制来看,提出基于事件链的表示模型,将事件链作为语篇连贯的必要条件,既一定程度模拟语篇的语义内容,又可确保可计算性。 第三,从分析模型看,基于事件链的分析模型为大规模处理汉语篇章级深层理解和信息奠定计算基础。 第四,从资源建造来看,建设大规模的事件链标注资源,可用于训练和测试,也可用于更一般的篇章语义分析任务。
[Abstract]:......
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2013
【分类号】:H15

【参考文献】

相关期刊论文 前10条

1 M.A.K.韩礼德;姜望琪;付毓玲;;篇章、语篇、信息——系统功能语言学视角[J];北京大学学报(哲学社会科学版);2011年01期

2 许余龙;;向心理论的参数化研究[J];当代语言学;2008年03期

3 黄昌宁;大规模真实文本处理的理论与方法——记第五届国际极大规模语料库研讨会(WVLC-5)[J];当代语言学;1998年01期

4 姜吉发;一种跨语句汉语事件信息抽取方法[J];计算机工程;2005年02期

5 姚双云;胡金柱;舒江波;沈威;;篇章连贯语义关系的自动标注方法[J];计算机工程;2012年07期

6 刘德喜;姬东鸿;;基于基本要素的文摘内容连贯性评测模型[J];计算机学报;2008年04期

7 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期

8 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期

9 索红光;刘玉树;曹淑英;;一种基于词汇链的关键词抽取方法[J];中文信息学报;2006年06期

10 张钹;;自然语言处理的计算模型[J];中文信息学报;2007年03期

相关博士学位论文 前4条

1 孙肇春;汉语事体结构[D];广东外语外贸大学;2007年

2 乐明;汉语财经评论的修辞结构标注及篇章研究[D];中国传媒大学;2006年

3 樊友新;从事件结构到句子结构[D];华东师范大学;2010年

4 付剑锋;面向事件的知识处理研究[D];上海大学;2010年

相关硕士学位论文 前2条

1 丁效;句子级中文事件抽取关键技术研究[D];哈尔滨工业大学;2011年

2 王静;汉语V-R动结式的事件结构理论研究[D];湖南大学;2008年



本文编号:1597388

资料下载
论文发表

本文链接:https://www.wllwen.com/jiaoyulunwen/duiwaihanyulunwen/1597388.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f6094***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com