当前位置:主页 > 科技论文 > 软件论文 >

基于翻译关系图的复述获取方法研究

发布时间:2018-10-08 14:09
【摘要】:复述是同一语言内,相同语义的不同表述方式,是语言活动中普遍存在的现象,反映了自然语言的多样性和复杂性,是机器理解自然语言的标准之一。随着自然语言处理中词语切分、句法分析等底层技术不断发展,复述研究越来越受到研究者的关注,其中,复述的研究内容主要包括复述知识获取和复述生成。由于复述实例库在领域和规模上的局限性,研究人员尝试利用更易获取的大规模双语平行语料来抽取复述知识,提出基于“枢轴”的复述知识获取方法。“枢轴”法的基本假设是:若同一语言中的两个短语对应相同的外文翻译,那么它们之间就可能存在复述关系。在利用大规模双语语料获取复述知识中,传统“枢轴”法只能考虑两步以内的复述现象。本文针对传统方法的局限性,提出了改进方法并设计实验验证本文所提方法的有效性。具体工作包括以下几方面:(1)提出基于短语翻译表的翻译关系图构建方法。在大规模短语翻译表中,同一语言某个短语可能对应多个外文翻译。传统“枢轴”法在利用大规模短语表获取复述短语的方法中,只考虑对应同一外文翻译的两个短语之间复述的可能性,有局限性。本文提出基于短语翻译表构建翻译关系图的方法,用以表示大规模短语翻译表中短语之间丰富的翻译关系,成为本文利用翻译关系图设计复述短语获取算法的基础。(2)设计基于随机行走N步的复述获取算法和基于期望步数的复述短语可信度计算方法。解决图中相似节点搜索问题的典型方法是基于随机行走的排序算法。研究者尝试在排序算法中融合取样技术与剪枝方法,提出一种高效的图中节点相似度的量化计算方法,本文采用该方法实现基于随机行走的复述短语获取。同时,我们使用期望步数对复述短语可信度进行评价,并按照可信度从大到小对复述短语结果排序。(3)提出利用多语言对扩展翻译关系图的方法。本文在(1)中利用双语短语翻译表构建的翻译关系图,两个短语通过与同一个外文短语的翻译关系建立复述联系。但是,本文研究发现这样图中会出现很多孤立的子图。为了解决这个问题,本文进一步提出引入新的语言对扩展翻译关系图的方法,有效提升复述短语获取的效率。(4)基于词向量的复述短语语义计算。词向量是一种基于神经网络的语言表示方法,本文基于词向量实现复述短语的语义表示,进而计算不同短语之间的语义距离,并与期望步数进行相关性比较。本文对所提出的改进方法进行实验验证,实验数据采用NTCIR汉英和英日双语平行语料,分别设计不同实验,并与传统基于“枢轴”的复述获取方法进行了对比。实验结果表明,本文所提出的方法能够获取更多的复述知识,而且扩展语言对的翻译关系图能够有效获取更多潜在的复述知识。同时,本文利用期望步数作为复述短语可信度的评价依据对输出复述短语排序,能够将与测试短语语义最相近的复述短语结果排在靠前的位置,证明了期望步数作为复述短语可信度的评价依据是有效可行的。另外,利用词向量构建的复述短语义向量表示和期望步数之间具有负相关性,更进一步证明了期望步数作为复述短语可信度的评价依据是正确有效的。
[Abstract]:......
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1

【相似文献】

相关期刊论文 前9条

1 康乐;蔡懿慈;洪先龙;;随机行走算法研究及其在电源/地线网络瞬态优化中的应用[J];计算机辅助设计与图形学学报;2007年09期

2 倪峗;;网络偏好随机行走中负载和主本征矢的线性关联[J];信息系统工程;2011年08期

3 王威;狄鹏;胡斌;;基于随机行走介数的级联失效模型[J];系统工程与电子技术;2012年09期

4 符永铨;王意洁;周婧;;基于自适应随机行走的可扩展无偏抽样方法[J];软件学报;2009年03期

5 朱小飞;郭嘉丰;程学旗;兰艳艳;;基于吸收态随机行走的两阶段效用性查询推荐方法[J];计算机研究与发展;2013年12期

6 马行空;王意洁;郑重;;基于随机行走的自适应规模估计方法[J];计算机工程;2010年12期

7 孙泽武;朱恒亮;曾璇;;考虑悬浮哑元的结构化随机行走电容提取算法[J];复旦学报(自然科学版);2014年01期

8 邓俊勇;钱江华;卓成;周金芳;陈抗生;;用于电源/地网络分析的随机行走算法改进[J];浙江大学学报(工学版);2007年08期

9 骆祖莹,王国璞,蔡懿慈,洪先龙,Sheldon,X.-D.Tan;基于部分随机行走的电源线/地线(P/G)网络快速求解方法[J];计算机辅助设计与图形学学报;2004年11期

相关会议论文 前8条

1 李敏;张永生;郭光灿;;周期势场中的直线量子随机行走[A];第十五届全国量子光学学术报告会报告摘要集[C];2012年

2 薛鹏;;可扩展的一维及高维量子随机行走的物理实现[A];第十四届全国量子光学学术报告会报告摘要集[C];2010年

3 陈唯;;细胞迁移中的反常随机行走[A];第七届全国液体和软物质物理学术会议程序册及论文摘要集[C];2010年

4 吴亮;朱士群;;复杂网络上基于负载的偏好随机行走[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年

5 顾国庆;余建华;;迷宫不稳定性的随机行走模型[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年

6 赵健伟;陈天南;黎绍洪;张世界;;利用随机行走模拟分子扩散[A];中国化学会第27届学术年会第14分会场摘要集[C];2010年

7 骆祖莹;王国璞;蔡懿慈;洪先龙;Sheldon;X.-D.Tan;;基于部分随机行走的电源线/地线(P/G)网络快速求解算法[A];全国第13届计算机辅助设计与图形学(CAD/CG)学术会议论文集[C];2004年

8 林方;包景东;;运用CTRW-Metropolis模型数值研究亚稳势中粒子逃逸问题[A];全国计算物理学会第六届年会和学术交流会论文摘要集[C];2007年

相关博士学位论文 前3条

1 李敏;量子随机行走的基本性质及应用研究[D];中国科学技术大学;2013年

2 傅应强;基于随机行走方法的微纳受限空间粒子扩散模拟[D];南京大学;2013年

3 吴亮;有限信息背景下的网络结构和行为[D];苏州大学;2009年

相关硕士学位论文 前10条

1 景兴利;随机行走在复杂网络上的交通行为特性分析[D];合肥工业大学;2015年

2 张宇超;高概率量子随机行走搜索算法研究[D];解放军信息工程大学;2015年

3 马军;基于翻译关系图的复述获取方法研究[D];北京交通大学;2017年

4 张国春;平面上的一种随机行走模型及其计算机模拟[D];河北大学;2010年

5 丁铁红;平面上一特殊的随机行走模型[D];河北大学;2009年

6 李筠;量子随机行走搜索算法研究[D];华东师范大学;2006年

7 陈莉莉;随机行走理论在微型分离器件模拟研究中的应用[D];南京大学;2013年

8 胡耀光;复杂网络上的随机行走[D];陕西师范大学;2014年

9 王文娟;非均匀量子随机行走中波包扩散的动力学行为研究[D];南京师范大学;2014年

10 李县法;大亚湾潮流场拟谱法计算及物质扩散的粒子随机行走模拟[D];暨南大学;2007年



本文编号:2257053

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2257053.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ed60d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com