当前位置:主页 > 科技论文 > 软件论文 >

非独立同分布词语相关度计算方法研究

发布时间:2022-12-10 06:58
  词语相关度计算,即度量两个词语表达意义的近似程度。它是自然语言处理领域的一项基础性研究,对文本分类、自动问答、词义消歧、机器翻译等上层任务有着重要的影响。词语的表示学习是词语相关度计算中一项基础而核心的工作,获取高质量的词语表示是提高词语相关度计算结果的有效方式。本文试图从提高词语的表示学习质量这一角度出发进行相关研究,在非独立同分布学习理论(not independent and identically distributed learning,简写non-IID learning)的指导下,充分挖掘概念之间的耦合关系,生成高质量的概念向量,再通过概念映射将词语与概念关联起来,利用概念向量计算词语相关度,进而改善文本分类、自动问答等上层应用的效果。本文的主要工作和贡献体现在下述三个方面:(1)针对传统的词语相关度计算方法混淆语义概念信息且忽视概念耦合关系的问题,本文提出了基于非独立同分布学习的词语概念表示方法和词语相关度计算方法。本文充分挖掘概念描述和知识网络蕴含的多种概念耦合关系,包含概念描述中的显式概念共现耦合、知识网络中的显式概念超链接耦合以及两者之间的隐式概念耦合;提出了基于... 

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第1章 绪论
    1.1 研究背景
    1.2 研究目的和意义
    1.3 主要研究内容
    1.4 论文组织结构
第2章 词语相关度计算技术
    2.1 引言
    2.2 基于语义词典的方法
    2.3 基于语料库的统计方法
    2.4 基于语料库的深度学习方法
    2.5 本章小结
第3章 基于non-IID的词语相关度计算方法
    3.1 引言
    3.2 non-IID相关度计算框架
    3.3 基于non-IID的概念表示方法
        3.3.1 维基百科概念
        3.3.2 显式概念共现耦合表示学习
        3.3.3 显式概念链接耦合表示学习
        3.3.4 隐式概念耦合表示学习
    3.4 实验与分析
        3.4.1 数据预处理
        3.4.2 相关度计算
        3.4.3 基线模型
        3.4.4 评价指标
        3.4.5 参数设置
        3.4.6 结果分析
    3.5 本章小结
第4章 基于non-IID词语表示的文本分类方法
    4.1 引言
    4.2 基于non-IID词语表示的文本分类方法
        4.2.1 系统框架
        4.2.2 预处理
        4.2.3 文本特征构建
        4.2.4 文本分类
    4.3 实验与分析
        4.3.1 数据集
        4.3.2 评价指标
        4.3.3 基线模型
        4.3.4 实验参数
        4.3.5 结果分析
    4.4 本章小结
第5章 基于non-IID词语表示的医疗问答方法
    5.1 引言
    5.2 基于non-IID词语表示的医疗问答系统
        5.2.1 系统框架
        5.2.2 嵌入模块
        5.2.3 问答编码器模块
        5.2.4 损失函数
    5.3 实验与分析
        5.3.1 数据集
        5.3.2 评价指标
        5.3.3 基线模型
        5.3.4 实验参数
        5.3.5 结果分析
    5.4 本章小结
第6章 结论与工作展望
    6.1 结论
    6.2 工作展望
参考文献
致谢
在学期间主要科研成果
    一、发表学术论文
    二、发明专利情况
    三、获奖情况
    四、参与科研项目


【参考文献】:
期刊论文
[1]基于路径与词林编码的词语相似度计算方法[J]. 王松松,高伟勋,徐逸凡.  计算机工程. 2018(10)
[2]一种改进的基于知网的词语语义相似度算法[J]. 张小川,于旭庭,张宜浩.  计算机应用研究. 2018(08)
[3]基于领域知识和词向量的词义消歧方法[J]. 杨安,李素建,李芸.  北京大学学报(自然科学版). 2017(02)
[4]基于LDA的中文词语相似度计算[J]. 吕亚伟,李芳,戴龙龙.  北京化工大学学报(自然科学版). 2016(05)
[5]基于知网与词林的词语语义相似度计算[J]. 朱新华,马润聪,孙柳,陈宏朝.  中文信息学报. 2016(04)
[6]中文短文本语法语义相似度算法[J]. 廖志芳,周国恩,李俊锋,刘飞,蔡飞.  湖南大学学报(自然科学版). 2016(02)
[7]《同义词词林》在中文实体关系抽取中的作用[J]. 刘丹丹,彭成,钱龙华,周国栋.  中文信息学报. 2014(02)
[8]基于大规模语料库的汉语词义相似度计算方法[J]. 石静,吴云芳,邱立坤,吕学强.  中文信息学报. 2013(01)
[9]基于词林的词语相似度的度量[J]. 吕立辉,梁维薇,冉蜀阳.  现代计算机(专业版). 2013(01)
[10]词汇相似度研究进展综述[J]. 刘萍,陈烨.  现代图书情报技术. 2012(Z1)

硕士论文
[1]知识库与语料库相结合的语义相似度的研究与实现[D]. 施凯伦.北京交通大学 2016
[2]基于上下文的词语相似度计算及其应用[D]. 郭丽.沈阳航空工业学院 2009



本文编号:3716299

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3716299.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5fd7d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com