基于LDA的国内图书情报学学科交叉及演化研究
发布时间:2023-12-24 17:07
当代科学技术日新月异,学科领域纷繁复杂,知识门类在高度分化的同时又不断趋向综合,只研究单一学科难以满足当今社会的需求,因此面向多学科的研究逐步发展起来。本文利用LDA主题模型研究国内图书情报学学科交叉现状及演化态势,主要分为以下5步:(1)下载CSSCI数据库图书情报学10种核心期刊近十五年共35472篇文献的题录信息,利用自编程序提取这些文献的参考文献对应的期刊名,并归类到相应学科。(2)形成学科交叉三级指标,确定管理学、法学、医学3个学科为图书情报学的三个交叉学科,利用python程序爬取近十五年这3个学科论文的摘要86075篇。(3)使用jieba分词软件对获取的摘要进行分词,利用Notepad++进行数据清洗。(4)基于Eclipse集成开发环境,运用困惑度确定模型主题数目,通过LDA提取3个学科近十五年的研究主题,根据主题-词项概率分布文件进行主题标识,根据文档-主题概率分布文件计算各个主题的主题强度,对与国内图书情报学交叉的学科主题进行具体分析。(5)引入时间因素,厘清图书情报学与三个学科的交叉文献隐含的知识信息,依据主题强度分布情况对主题演化态势进行分析,为相关人员进行科...
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景
1.2 研究意义
1.2.1 理论意义
1.2.2 实践意义
1.3 国内外相关研究现状
1.3.1 LDA主题模型国内外研究现状
1.3.2 图书情报学学科交叉国内外研究现状
1.3.3 研究现状述评
1.4 相关概念界定
1.4.1 学科交叉
1.4.2 学科交叉强度
1.5 研究内容和研究方法
1.5.1 研究内容
1.5.2 研究方法
1.6 本文的创新及结构
1.6.1 本文的创新
1.6.2 本文的结构
第2章 相关理论基础
2.1 LDA主题模型
2.1.1 LDA主题模型的表示
2.1.2 参数估计
2.1.3 新样本的推断
2.1.4 基于LDA的主题抽取原理
2.1.5 主题强度度量
2.2 学科交叉
2.2.1 学科交叉的研究方法
2.2.2 学科交叉的研究对象
2.2.3 学科交叉的演化特征
2.3 引文分析法
第3章 图书情报学与其他学科交叉强度分析
3.1 数据来源与处理
3.1.1 数据库的选取
3.1.2 数据采集与处理
3.2 数据分析
3.2.1 2005-2009年学科交叉分析
3.2.2 2010-2014年学科交叉分析
3.2.3 2015-2019年学科交叉分析
3.2.4 2005-2019年总体学科交叉分析
第4章 基于LDA的图书情报学学科交叉主题发现
4.1 研究对象的选取
4.2 图书情报学与管理学学科知识交叉主题发现
4.2.1 数据预处理
4.2.2 模型训练
4.2.3 实验结果与分析
4.3 图书情报学与法学学科知识交叉主题发现
4.3.1 数据预处理
4.3.2 模型训练
4.3.3 实验结果与分析
4.4 图书情报学与医学学科知识交叉主题发现
4.4.1 数据预处理
4.4.2 模型训练
4.4.3 实验结果与分析
第5章 基于LDA的图书情报学学科交叉主题演化分析
5.1 主题强度分布
5.1.1 图书情报学与管理学交叉主题强度分布
5.1.2 图书情报学与法学交叉主题强度分布
5.1.3 图书情报学与医学交叉主题强度分布
5.2 主题演化
5.2.1 图书情报学与管理学交叉主题演化
5.2.2 图书情报学与法学交叉主题演化
5.2.3 图书情报学与医学交叉主题演化
第6章 结语
6.1 研究结论
6.2 研究不足与展望
6.2.1 研究不足
6.2.2 研究展望
附录A 将参考文献归类到相应学科的程序
附录B 爬取三个学科论文摘要的程序
参考文献
在读期间发表的学术论文及研究成果
致谢
本文编号:3874946
【文章页数】:82 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 引言
1.1 研究背景
1.2 研究意义
1.2.1 理论意义
1.2.2 实践意义
1.3 国内外相关研究现状
1.3.1 LDA主题模型国内外研究现状
1.3.2 图书情报学学科交叉国内外研究现状
1.3.3 研究现状述评
1.4 相关概念界定
1.4.1 学科交叉
1.4.2 学科交叉强度
1.5 研究内容和研究方法
1.5.1 研究内容
1.5.2 研究方法
1.6 本文的创新及结构
1.6.1 本文的创新
1.6.2 本文的结构
第2章 相关理论基础
2.1 LDA主题模型
2.1.1 LDA主题模型的表示
2.1.2 参数估计
2.1.3 新样本的推断
2.1.4 基于LDA的主题抽取原理
2.1.5 主题强度度量
2.2 学科交叉
2.2.1 学科交叉的研究方法
2.2.2 学科交叉的研究对象
2.2.3 学科交叉的演化特征
2.3 引文分析法
第3章 图书情报学与其他学科交叉强度分析
3.1 数据来源与处理
3.1.1 数据库的选取
3.1.2 数据采集与处理
3.2 数据分析
3.2.1 2005-2009年学科交叉分析
3.2.2 2010-2014年学科交叉分析
3.2.3 2015-2019年学科交叉分析
3.2.4 2005-2019年总体学科交叉分析
第4章 基于LDA的图书情报学学科交叉主题发现
4.1 研究对象的选取
4.2 图书情报学与管理学学科知识交叉主题发现
4.2.1 数据预处理
4.2.2 模型训练
4.2.3 实验结果与分析
4.3 图书情报学与法学学科知识交叉主题发现
4.3.1 数据预处理
4.3.2 模型训练
4.3.3 实验结果与分析
4.4 图书情报学与医学学科知识交叉主题发现
4.4.1 数据预处理
4.4.2 模型训练
4.4.3 实验结果与分析
第5章 基于LDA的图书情报学学科交叉主题演化分析
5.1 主题强度分布
5.1.1 图书情报学与管理学交叉主题强度分布
5.1.2 图书情报学与法学交叉主题强度分布
5.1.3 图书情报学与医学交叉主题强度分布
5.2 主题演化
5.2.1 图书情报学与管理学交叉主题演化
5.2.2 图书情报学与法学交叉主题演化
5.2.3 图书情报学与医学交叉主题演化
第6章 结语
6.1 研究结论
6.2 研究不足与展望
6.2.1 研究不足
6.2.2 研究展望
附录A 将参考文献归类到相应学科的程序
附录B 爬取三个学科论文摘要的程序
参考文献
在读期间发表的学术论文及研究成果
致谢
本文编号:3874946
本文链接:https://www.wllwen.com/falvlunwen/zhishichanquanfa/3874946.html