当前位置:主页 > 科技论文 > 软件论文 >

基于词对和词典的句子对齐研究

发布时间:2022-10-10 16:39
  句子对齐是将源语言文本中的句子映射到目标语言文本中对应翻译的过程,作为构建和扩充平行语料库的核心技术,其性能的优劣影响着平行语料库的质量。本文集中于通过神经网络建模句对间的词对关系、词对重要性以及融入词典知识来改进句子对齐性能的研究,主要内容如下:(1)基于词对建模的句子对齐。考虑到相互对齐的两个句子中通常含有大量相互对齐的词对这一事实,本文探索源语言句子和目标语言句子之间的词对关系,并提出了基于词对建模的句子对齐方法。该方法首先利用双向循环神经网络来编码输入的句对,然后使用门关联网络来计算句对中词对的语义关系,并通过多层感知器进一步融合语义关系来判断该句对是否对齐。(2)带多视角注意力的基于词对驱动句子对齐。考虑到对齐的句对中包含多个对齐的词对,而这些词对在句对语义关系中又扮演着不同重要程度的角色,本文探讨了建模词对重要性及其关系的句子对齐方法。首先通过融合三种相似性度量方法的词对关联网络从三种角度获取词对间语义关系,然后利用多视角注意力网络同样地从三种角度对词对重要性进行建模,最后通过二者结合来确定句对是否对齐。(3)融入词典知识的基于词对驱动句子对齐。受大部分借助外部词典的句子对... 

【文章页数】:81 页

【学位级别】:硕士

【文章目录】:
中文摘要
Abstract
第1章 绪论
    1.1 研究背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 研究现状
    1.3 研究内容
    1.4 论文组织结构
第2章 相关知识
    2.1 句子对齐任务简介
    2.2 句子对齐算法
    2.3 双向循环神经网络
        2.3.1 门控循环单元
        2.3.2 双向循环神经网络
    2.4 语料资源和性能评测指标
        2.4.1 语料资源
        2.4.2 性能评测指标
    2.5 本章小结
第3章 基于词对建模的句子对齐
    3.1 引言
    3.2 问题描述
    3.3 基于词对建模的神经网络模型
        3.3.1 词向量层
        3.3.2 双向循环神经网络层
        3.3.3 门关联网络层
        3.3.4 最大池化层
        3.3.5 多层感知器层
    3.4 实验结果与分析
        3.4.1 实验设置
        3.4.2 实验结果
        3.4.3 实验分析
    3.5 本章小结
第4章 带多视角注意力的基于词对驱动句子对齐
    4.1 引言
    4.2 多视角注意力的词对关联网络模型
        4.2.1 双向循环神经网络
        4.2.2 词对关联网络
        4.2.3 多视角注意力网络
        4.2.4 最大池化和多层感知器
        4.2.5 模型训练
    4.3 实验结果与分析
        4.3.1 实验设置
        4.3.2 实验结果
        4.3.3 实验分析
    4.4 本章小结
第5章 融入词典知识的基于词对驱动句子对齐
    5.1 引言
    5.2 融入词典知识的词对关联网络模型
        5.2.1 基于词典建模的神经网络模型
        5.2.2 混合编码器
        5.2.3 特征编码器
        5.2.4 门控编码器
    5.3 构建双语词典
    5.4 实验结果与分析
        5.4.1 实验设置
        5.4.2 实验结果
        5.4.3 实验分析
    5.5 本章小结
第6章 总结与展望
    6.1 总结
    6.2 展望
参考文献
攻读学位期间取得的科研成果
攻读学位期间参与的科研项目
致谢


【参考文献】:
期刊论文
[1]基于词对关联网络的句子对齐研究[J]. 丁颖,李军辉,周国栋.  中文信息学报. 2019(07)
[2]汉英句子对齐长度计算方法的研究[J]. 张霞,昝红英,张恩展.  计算机工程与设计. 2009(18)
[3]基于长度和位置信息的双语句子对齐方法[J]. 李维刚,刘挺,张宇,李生.  哈尔滨工业大学学报. 2006(05)
[4]汉英双语库自动分段对齐研究[J]. 王斌,刘群,张祥.  软件学报. 2000(11)



本文编号:3689986

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3689986.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户02529***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com