基于Bi-LSTM-CRF模型的知识单元挖掘及流动模式研究
发布时间:2024-06-05 03:37
知识单元是指包含知识信息的微观粒子,是知识信息的载体,同时也是知识在细粒度上的体现,在社会文明发展的过程中发挥着不可或缺的作用。引用语境是施引者在引用文献时的一种描述性文字,包含施引者的引用动机、情感和目的等。建立科学、合理、高效的机器学习模型,提取引用语境中的知识单元并对其进行流动模式研究,可以帮助学者有效了解知识和技术的更新和发展,为学者在其研究领域提供方向和思路有着重要的实际意义。为了解决尚未有公开的引用语境中知识单元数据集的问题,本文针对生物医学领域,选取了Pub Med网站上2008年到2018年按比例抽取的1000篇文本数据,提取了引用语境等信息并对知识单元进行了标注,构建一套较为完善的数据集。同时提取了数据的一般语义特征、字符特征、大小写特征、基于词向量的布朗聚类特征,构建了Bi-LSTM-CRF的知识单元挖掘模型,并通过实验对CRF模型和Bi-LSTM-CRF模型进行对比分析。实验结果表明,Bi-LSTM-CRF模型的识别效果要好,在三个评价指标的数值上都要高于CRF模型,其精确度为0.7618,召回率为0.7099,1值为0.7349,在
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及意义
1.2 研究内容
1.3 研究方法与技术路线
1.4 特色与创新之处
2 国内外文献述评
2.1 知识单元抽取方面的研究
2.1.1 基于模式匹配
2.1.2 基于机器学习
2.1.3 基于深度学习
2.2 知识流动模式的研究
2.2.1 文献领域的知识流动
2.2.2 专利领域的知识流动
3 基于引用语境的数据集构建及标注
3.1 数据获取及预处理
3.2 数据库统计与描述
3.3 知识单元划分和数据标注
3.3.1 知识单元划分
3.3.2 数据标注
3.4 本章小结
4 基于Bi-LSTM-CRF模型的知识单元挖掘
4.1 相关理论技术的介绍
4.1.1 词向量层
4.1.2 CRF模型
4.1.3 LSTM模型
4.2 Bi-LSTM-CRF模型的构建
4.2.1 Bi-LSTM-CRF模型
4.2.2 特征提取
4.2.3 评测标准
4.3 实验及结果分析
4.3.1 实验数据集
4.3.2 实验及结果分析
4.3.3 对比分析
4.4 本章小结
5 知识单元的流动模式分析
5.1 异构信息网络
5.1.1 异构信息网络基本概念
5.1.2 异构网络分析及其应用
5.2 知识单元的流动模式
5.2.1 宏观层面的知识单元流动模式
5.2.2 微观层面的知识单元流动模式
5.3 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
个人简介
导师简介
致谢
本文编号:3989593
【文章页数】:60 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
1 绪论
1.1 研究背景及意义
1.2 研究内容
1.3 研究方法与技术路线
1.4 特色与创新之处
2 国内外文献述评
2.1 知识单元抽取方面的研究
2.1.1 基于模式匹配
2.1.2 基于机器学习
2.1.3 基于深度学习
2.2 知识流动模式的研究
2.2.1 文献领域的知识流动
2.2.2 专利领域的知识流动
3 基于引用语境的数据集构建及标注
3.1 数据获取及预处理
3.2 数据库统计与描述
3.3 知识单元划分和数据标注
3.3.1 知识单元划分
3.3.2 数据标注
3.4 本章小结
4 基于Bi-LSTM-CRF模型的知识单元挖掘
4.1 相关理论技术的介绍
4.1.1 词向量层
4.1.2 CRF模型
4.1.3 LSTM模型
4.2 Bi-LSTM-CRF模型的构建
4.2.1 Bi-LSTM-CRF模型
4.2.2 特征提取
4.2.3 评测标准
4.3 实验及结果分析
4.3.1 实验数据集
4.3.2 实验及结果分析
4.3.3 对比分析
4.4 本章小结
5 知识单元的流动模式分析
5.1 异构信息网络
5.1.1 异构信息网络基本概念
5.1.2 异构网络分析及其应用
5.2 知识单元的流动模式
5.2.1 宏观层面的知识单元流动模式
5.2.2 微观层面的知识单元流动模式
5.3 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
个人简介
导师简介
致谢
本文编号:3989593
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3989593.html
最近更新
教材专著