基于Bi-LSTM-CRF模型的知识单元挖掘及流动模式研究

发布时间:2024-06-05 03:37
  知识单元是指包含知识信息的微观粒子,是知识信息的载体,同时也是知识在细粒度上的体现,在社会文明发展的过程中发挥着不可或缺的作用。引用语境是施引者在引用文献时的一种描述性文字,包含施引者的引用动机、情感和目的等。建立科学、合理、高效的机器学习模型,提取引用语境中的知识单元并对其进行流动模式研究,可以帮助学者有效了解知识和技术的更新和发展,为学者在其研究领域提供方向和思路有着重要的实际意义。为了解决尚未有公开的引用语境中知识单元数据集的问题,本文针对生物医学领域,选取了Pub Med网站上2008年到2018年按比例抽取的1000篇文本数据,提取了引用语境等信息并对知识单元进行了标注,构建一套较为完善的数据集。同时提取了数据的一般语义特征、字符特征、大小写特征、基于词向量的布朗聚类特征,构建了Bi-LSTM-CRF的知识单元挖掘模型,并通过实验对CRF模型和Bi-LSTM-CRF模型进行对比分析。实验结果表明,Bi-LSTM-CRF模型的识别效果要好,在三个评价指标的数值上都要高于CRF模型,其精确度为0.7618,召回率为0.7099,1值为0.7349,在

【文章页数】:60 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
1 绪论
    1.1 研究背景及意义
    1.2 研究内容
    1.3 研究方法与技术路线
    1.4 特色与创新之处
2 国内外文献述评
    2.1 知识单元抽取方面的研究
        2.1.1 基于模式匹配
        2.1.2 基于机器学习
        2.1.3 基于深度学习
    2.2 知识流动模式的研究
        2.2.1 文献领域的知识流动
        2.2.2 专利领域的知识流动
3 基于引用语境的数据集构建及标注
    3.1 数据获取及预处理
    3.2 数据库统计与描述
    3.3 知识单元划分和数据标注
        3.3.1 知识单元划分
        3.3.2 数据标注
    3.4 本章小结
4 基于Bi-LSTM-CRF模型的知识单元挖掘
    4.1 相关理论技术的介绍
        4.1.1 词向量层
        4.1.2 CRF模型
        4.1.3 LSTM模型
    4.2 Bi-LSTM-CRF模型的构建
        4.2.1 Bi-LSTM-CRF模型
        4.2.2 特征提取
        4.2.3 评测标准
    4.3 实验及结果分析
        4.3.1 实验数据集
        4.3.2 实验及结果分析
        4.3.3 对比分析
    4.4 本章小结
5 知识单元的流动模式分析
    5.1 异构信息网络
        5.1.1 异构信息网络基本概念
        5.1.2 异构网络分析及其应用
    5.2 知识单元的流动模式
        5.2.1 宏观层面的知识单元流动模式
        5.2.2 微观层面的知识单元流动模式
    5.3 本章小结
6 总结与展望
    6.1 总结
    6.2 展望
参考文献
个人简介
导师简介
致谢



本文编号:3989593

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3989593.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ef66d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com