基于跨语言词向量的句子对齐方法研究
【文章页数】:57 页
【学位级别】:硕士
【部分图文】:
图1-1维基百科的“社会语言学”词条的中文与英语网页节选Fig.1-1ExcerptsfromtheChineseandEnglishentryofSociolinguisticsonthewebpagesofWikipedia
哈尔滨理工大学工学硕士学位论文-2-中可比语料成为了平行语料资源的重要补充资源,研究者们提出了一系列的句子对齐方法,从网络上大量存在的可比语料中抽取出可用于跨语言自然语言处理任务的平行语料。图1-1维基百科的“社会语言学”词条的中文与英语网页节选Fig.1-1Excerptsfr....
图2-1两种基于神经网络的句子对齐方法结构
哈尔滨理工大学工学硕士学位论文-9-进行英语和德语间的双向的翻译。在训练好NMT模型后,丢弃解码器,使用编码器将任意语言的句子表示为一个固定长度的连续的向量表示,得到句子的向量表示后计算向量间的距离作为句对的相似度得分[17-21]。a)双编码器结构b)编码器-解码器结构a)Th....
图2-2四个西班牙词的上下文相关的词向量的二维主成分分析示例图
哈尔滨理工大学工学硕士学位论文-12-下文相关的词向量ELMo的训练方法,训练一种源语言s和一种目标语言t的上下文相关的词向量,然后在此基础上提出了三种语义向量对齐方法,将两种语言的上下文相关的词向量进行语义空间上的对齐。图2-2四个西班牙词的上下文相关的词向量的二维主成分分析示....
图3-1基于跨语言词向量的句子相似度计算方法整体流程
哈尔滨理工大学工学硕士学位论文-16-别上,我们提出了一种结合向量角度和绝对距离两者的优势的词向量相似度计算方法。其次,在句子级别上,我们基于上一步词级别的相似度计算方法,提出了基于聚合方法的双语句对的相似度计算方法。最后介绍了基于边距的方法,并在句子相似度实验上验证我们提出的方....
本文编号:3994793
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3994793.html