基于多层协同纠错的中文层次句法分析
本文关键词:基于多层协同纠错的中文层次句法分析 出处:《中文信息学报》2014年04期 论文类型:期刊论文
更多相关文章: 层次句法分析 条件随机域模型 组块分析 多层协同纠错
【摘要】:层次句法分析是一种简单快速的完全句法分析方法,该方法将句法分析分解为词性标注、组块分析和构建句法树三个阶段。该文将其中的组块分析细分为基本块分析和复杂块分析,利用条件随机域模型代替最大熵模型进行序列化标注。由于层次句分析中错误累积问题尤为严重,该文提出了一种简单可行的错误预判及协同纠错算法,跟踪本层预判的错误标注结果进入下一层,利用两层预测分数相结合的方式协同纠错。实验结果表明,加入纠错方法后,层次句法分析在保证解析速度的同时,获得了与主流中文句法分析器相当的解析精度。
[Abstract]:Hierarchical syntactic analysis is a simple and fast method of complete syntactic analysis, which decomposes syntactic analysis into part of speech tagging. There are three stages of block analysis and syntactic tree construction. In this paper, the block analysis is subdivided into basic block analysis and complex block analysis. The conditional random domain model is used instead of the maximum entropy model for serialization tagging. As the problem of error accumulation in hierarchical sentence analysis is particularly serious, a simple and feasible algorithm for error prediction and cooperative error correction is proposed in this paper. Tracking the error-tagging results of this layer into the next layer, using the combination of two levels of prediction scores to coordinate error correction. Experimental results show that, after adding error correction method, the hierarchical syntactic analysis can ensure the parsing speed at the same time. The resolution accuracy is equivalent to that of the mainstream Chinese parser.
【作者单位】: 哈尔滨工业大学计算机科学与技术学院;
【基金】:国家自然科学基金(60975077,90924015)
【分类号】:H146
【正文快照】: 1引言句法分析是根据给定的语法体系,分析句子所包含的语法单元和这些语法单元之间的关系[1],将句子转化为一个非线性的数据结构(例如,短语结构树或有向无环图),形式化定义为WR/→迤KT,其中,W=w1,w2,…,wn为输入句子的词序列,T为一系列短语、词语和符号构成的树形拓扑层次结
【相似文献】
相关期刊论文 前10条
1 姚红;“吃食堂”类动宾结构研究综述[J];文教资料;2005年21期
2 王新周;;从句法、语义角度阐释“花园小径现象”形成原因[J];文教资料;2009年36期
3 刘潇;;简述句法与语义分析及其关系[J];广东技术师范学院学报;2011年02期
4 易蓉湘,何克抗;计算机汉语文稿校对系统[J];计算机研究与发展;1997年05期
5 杨翠兰;汉语成语的语法功能研究[J];烟台教育学院学报;2005年03期
6 黄文星;;从歧义分化看汉语句法分析方法的拓展演变[J];湘潮(下半月);2010年11期
7 何姗;;“V起来”的句法分析[J];安徽文学(下半月);2011年06期
8 岳方遂;三个平面:语法研究的多维视野——黄山语法修辞座谈会发言摘要[J];语言教学与研究;1992年01期
9 王功平;“有着”与“具有”语义、语用及句法分析[J];语文学刊;2003年01期
10 钱小飞;;“地”字结构识别[J];现代语文(语言研究版);2006年05期
相关会议论文 前10条
1 斯·劳格劳;华沙宝;萨如拉;;基于统计方法的蒙古语依存句法分析模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 才藏太;;基于规则的汉藏机器翻译系统中二分法的句法分析方法研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
3 张晓甜;赵海;;基于树结构模式挖掘的非监督中文短语结构句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
4 曹海龙;孟遥;李生;赵铁军;;一个改进的头驱动英语句法分析模型[A];机器翻译研究进展——2002年全国机器翻译研讨会论文集[C];2002年
5 徐艳华;李斌;;信息处理用名词细分类研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
6 张亮;陈家骏;;基于大规模语料库的句法模式匹配研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 辛霄;范士喜;王轩;王晓龙;;基于最大熵的依存句法分析[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 钱小飞;陈小荷;;含“的”字偏正结构的最长名词短语的自动识别[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
9 周俏丽;蔡东风;张桂平;季铎;林晓庆;;基于最大熵的“vp np的np”句法结构排歧[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
10 卢俊之;陈小荷;曲维光;王东波;陈锋;丁德鑫;;基于语法功能匹配的汉语句法分析算法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
相关重要报纸文章 前1条
1 ;句法语文学科召开工作研讨会[N];中国社会科学院院报;2003年
相关博士学位论文 前10条
1 斯·劳格劳;现代蒙古语依存句法自动分析研究[D];内蒙古大学;2011年
2 唐秀玲;论话题及其在汉语语法分析中的应用[D];上海师范大学;1997年
3 徐艳华;现代汉语实词语法功能考察及词类体系重构[D];南京师范大学;2006年
4 刘水;融入头—修饰词调序模型的短语统计机器翻译方法研究[D];哈尔滨工业大学;2011年
5 洪淼;现代汉语连动结构研究[D];南京师范大学;2004年
6 申敬善;现代汉语“在”字句研究[D];复旦大学;2006年
7 屈刚;英汉双语短语对齐[D];上海交通大学;2007年
8 曹勇衡;基于阅读时间的二语习得者句子空隙处理研究[D];上海交通大学;2008年
9 黄婉梅;黎氏语法体系研究[D];安徽大学;2007年
10 吴晓芳;张斌语法思想研究[D];福建师范大学;2009年
相关硕士学位论文 前10条
1 刘t ;“程度副词+名词”的语义、语用和句法分析[D];四川师范大学;2005年
2 金天;论汉语及英语中否定歧义的消除[D];广东外语外贸大学;2007年
3 张萍;现代汉语标语语法研究[D];南京师范大学;2006年
4 魏蓉;限定领域的基本陈述句句法分析[D];天津师范大学;2008年
5 程林;基于规则和统计的名词句法分析研究及其在机械产品设计中的应用[D];西安电子科技大学;2013年
6 谌金中;“多/少+N”结构多角度考察[D];湖南师范大学;2006年
7 齐建涛;从“三个平面”语法理论看现代汉语受事主语句[D];陕西师范大学;2007年
8 林茜;《醒世姻缘传》反问句研究[D];山东师范大学;2009年
9 余加柱;同形词语法功能消歧[D];南京师范大学;2008年
10 崔善熙;鸠摩罗什译《维摩诘所说经》与敦煌本《维摩诘经讲经文》的‘之’字偏正结构用法比较研究[D];山东大学;2005年
,本文编号:1402915
本文链接:https://www.wllwen.com/wenyilunwen/yuyanxuelw/1402915.html