基于DBN的词义消歧研究
发布时间:2022-08-02 15:01
在汉语词汇中存在着一定数量的歧义词,虽然歧义词的出现为自然语言的应用带来了便利,但是也为自然语言的理解和翻译带来了一定的困难。词义消歧就是根据歧义词的上下文语境来判定它的真实语义。随着人工智能的兴起,词义消歧在诸多高新领域中的应用越来越多,已经成为了一个自然语言处理中需要解决的重要难题。通过对词义消歧领域知识的研究结合机器学习的相关知识,本文提出了一种基于深度信念网络(Deep Belief Network,DBN)的词义消歧方法,并以传统的基于贝叶斯模型的词义消歧方法和基于受限制玻尔兹曼机(Restricted Boltzmann Machine,RBM)模型的词义消歧方法作为对比。本文所提出的方法具有很强的分类能力,歧义词的消歧准确率比传统方法也有了很大的提高。本文的研究内容分为如下几个部分:首先,介绍了词义消歧的研究目的和意义,对国内外的研究现状和发展趋势进行了分析,并介绍了一些国内外权威的词义消歧方法以及课题的主要研究内容。其次,研究了自然语言学中的一些基础的知识,并对《同义词词林》做了详细的介绍。详细说明了贝叶斯分类器、RBM分类器和DBN分类器的消歧特征的选取过程。对于贝叶...
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题来源及研究的背景和意义
1.1.1 课题来源
1.1.2 词义消歧的目的和意义
1.2 词义消歧的研究状况
1.2.1 词义消歧的概述
1.2.2 国外研究进展
1.2.3 国内研究进展
1.3 课题研究的主要内容
1.4 本文的组织结构
第2章 词义消歧技术发展
2.1 基于词典的词义消歧方法
2.2 基于实例的词义消歧方法
2.3 基于统计学习的词义消歧方法
2.3.1 有指导的词义消歧方法
2.3.2 无指导的词义消歧方法
2.4 本章小结
第3章 语言学工程
3.1 词典介绍
3.2 语料准备
3.2.1 训练语料
3.2.2 测试语料
3.3 语料预处理
3.3.1 训练语料预处理
3.3.2 测试语料预处理
3.3.3 特征抽取及选择
3.4 本章小结
第4章 词义消歧模型的构建
4.1 监督学习方法的介绍
4.1.1 无监督学习方法
4.1.2 有监督学习方法
4.2 贝叶斯消歧模型构建
4.2.1 朴素贝叶斯公式
4.2.2 贝叶斯消歧模型构建
4.3 RBM消歧模型构建
4.3.1 RBM的基本原理
4.3.2 RBM消歧模型构建
4.4 DBN消歧模型构建
4.4.1 DBN的基本原理
4.4.2 DBN消歧模型构建
4.5 本章小结
第5章 实验
5.1 实验环境准备
5.2 实验过程描述
5.2.1 语料数据格式转换
5.2.2 实验过程描述
5.3 实验结果分析
5.4 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
致谢
【参考文献】:
期刊论文
[1]基于词义消歧的卷积神经网络文本分类模型[J]. 薛涛,王雅玲,穆楠. 计算机应用研究. 2018(10)
[2]基于领域知识和词向量的词义消歧方法[J]. 杨安,李素建,李芸. 北京大学学报(自然科学版). 2017(02)
[3]中文文本语义错误侦测方法研究[J]. 张仰森,郑佳. 计算机学报. 2017(04)
[4]基于语义一致性的集成实体链接算法[J]. 刘峤,钟云,刘瑶,吴祖峰,秦志光. 计算机研究与发展. 2016(08)
[5]基于图的不一致容忍语义下的查询应答方法[J]. 付雪峰,漆桂林,张勇. 计算机研究与发展. 2016(02)
[6]一种基于双通道LDA模型的汉语词义表示与归纳方法[J]. 王少楠,宗成庆. 计算机学报. 2016(08)
[7]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[8]基于知网义原词向量表示的无监督词义消歧方法[J]. 唐共波,于东,荀恩东. 中文信息学报. 2015(06)
[9]融合词义消歧的汉语句法分析方法研究[J]. 李冬晨,张献涛,樊扬,吴玺宏. 北京大学学报(自然科学版). 2015(04)
[10]基于上下文语境的词义消歧方法[J]. 杨陟卓. 计算机应用. 2015(04)
硕士论文
[1]基于SVM的离合词词义消歧[D]. 张振景.河北大学 2016
本文编号:3668739
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 课题来源及研究的背景和意义
1.1.1 课题来源
1.1.2 词义消歧的目的和意义
1.2 词义消歧的研究状况
1.2.1 词义消歧的概述
1.2.2 国外研究进展
1.2.3 国内研究进展
1.3 课题研究的主要内容
1.4 本文的组织结构
第2章 词义消歧技术发展
2.1 基于词典的词义消歧方法
2.2 基于实例的词义消歧方法
2.3 基于统计学习的词义消歧方法
2.3.1 有指导的词义消歧方法
2.3.2 无指导的词义消歧方法
2.4 本章小结
第3章 语言学工程
3.1 词典介绍
3.2 语料准备
3.2.1 训练语料
3.2.2 测试语料
3.3 语料预处理
3.3.1 训练语料预处理
3.3.2 测试语料预处理
3.3.3 特征抽取及选择
3.4 本章小结
第4章 词义消歧模型的构建
4.1 监督学习方法的介绍
4.1.1 无监督学习方法
4.1.2 有监督学习方法
4.2 贝叶斯消歧模型构建
4.2.1 朴素贝叶斯公式
4.2.2 贝叶斯消歧模型构建
4.3 RBM消歧模型构建
4.3.1 RBM的基本原理
4.3.2 RBM消歧模型构建
4.4 DBN消歧模型构建
4.4.1 DBN的基本原理
4.4.2 DBN消歧模型构建
4.5 本章小结
第5章 实验
5.1 实验环境准备
5.2 实验过程描述
5.2.1 语料数据格式转换
5.2.2 实验过程描述
5.3 实验结果分析
5.4 本章小结
结论
参考文献
攻读硕士学位期间所发表的学术论文
致谢
【参考文献】:
期刊论文
[1]基于词义消歧的卷积神经网络文本分类模型[J]. 薛涛,王雅玲,穆楠. 计算机应用研究. 2018(10)
[2]基于领域知识和词向量的词义消歧方法[J]. 杨安,李素建,李芸. 北京大学学报(自然科学版). 2017(02)
[3]中文文本语义错误侦测方法研究[J]. 张仰森,郑佳. 计算机学报. 2017(04)
[4]基于语义一致性的集成实体链接算法[J]. 刘峤,钟云,刘瑶,吴祖峰,秦志光. 计算机研究与发展. 2016(08)
[5]基于图的不一致容忍语义下的查询应答方法[J]. 付雪峰,漆桂林,张勇. 计算机研究与发展. 2016(02)
[6]一种基于双通道LDA模型的汉语词义表示与归纳方法[J]. 王少楠,宗成庆. 计算机学报. 2016(08)
[7]基于语义分析的评价对象-情感词对抽取[J]. 江腾蛟,万常选,刘德喜,刘喜平,廖国琼. 计算机学报. 2017(03)
[8]基于知网义原词向量表示的无监督词义消歧方法[J]. 唐共波,于东,荀恩东. 中文信息学报. 2015(06)
[9]融合词义消歧的汉语句法分析方法研究[J]. 李冬晨,张献涛,樊扬,吴玺宏. 北京大学学报(自然科学版). 2015(04)
[10]基于上下文语境的词义消歧方法[J]. 杨陟卓. 计算机应用. 2015(04)
硕士论文
[1]基于SVM的离合词词义消歧[D]. 张振景.河北大学 2016
本文编号:3668739
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3668739.html
最近更新
教材专著