基于LDA的国内图书情报学研究主题发现及其演化研究
发布时间:2021-10-29 06:39
21世纪信息化时代的图书情报学充满未知的机遇和挑战,随着计算机技术与互联网技术日新月异的发展及文献出版速度的加快,图书情报领域的研究成果呈现爆炸式增长的态势,主题也更为多样。主题模型可以帮助我们从信息文本中发现和提炼隐藏的、有积极作用的、可以分析的知识。LDA(Latent Dirichlet Allocation,隐含狄利克雷分配)是运用最为广泛的概率主题模型之一,是一个三层贝叶斯概率模型,由词、主题和文档三层结构组成。通过词袋(Bag Of Word)这一方法的运用,复杂的文本信息被转换成易于处理的数学信息。当前,图书情报领域聚焦于应用该模型进行科学文献主题挖掘及主题演化研究。本文运用LDA模型对国内图书情报学2006年至2017年这12年的研究文献进行主题发现。首先,运用困惑度来确定模型主题数目,根据主题-词项概率分布文件进行主题标识;其次,根据文档-主题概率分布文件计算各个主题的主题强度,对当今国内图书情报学研究主题进行具体分析;最后引入时间因素,依据主题强度分布情况对主题演化趋势进行分析,以期为我国图书情报学相关研究提供数据支撑与参考。在中国知网(CNKI)学术期刊数据库中,...
【文章来源】:曲阜师范大学山东省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
国外以LIS为研究方向的发文量
图 1-2 国内以主题演化为研究方向的发文量2004 年,邱均平教授等人以三种核心期刊作为数据统计分析的来源,采用内容分法,揭示了国内外 2003 年情报学重要研究领域,探索其未来发展趋向[19];2007 年,成教授等运用词频分析方法揭示了国内外知识管理研究的热点,并从多个方面进行了分析[20];2009 年,王萍选取三种国际教育技术期刊出版的文献作为研究对象,利用进行建模,并运用相似度这一指标进行测度,实现主题挖掘的目的[21];2009 年何静等一种客观赋权法—熵值法,揭示了电子学与信息系统学科研究热点,预测未来发展趋2012 年,王莉亚等为了探究信息整合主题演化情况,运用信息熵对来源数据进行分析,进而得到信息整合主题趋势[23];2013 年,李勇等运用相似度这一指标进行测度过观察主题在各个时间窗口内的变化,从主题偏移这一角度来探究主题演化趋势[24]。2014 年,胡吉明等采用增量 Gibbs 抽样估计算法对 LDA 模型进行了改进,构建LDA 主题模型,运用 LDA 主题模型进行主题发现,最后采用主题相似度和主题强度个指标探析主题演化情况[25];2017 年,程淋等人综合利用共词分析、聚类分析、战略图等科学计量方法动态分析了我国图书情报学在三个时间段的研究主题,发现图书情
图 1-3 国内以图书情报为主题的发文量我国图书情报—体化的历程始于 1978 年,1979 年至 1984 年处于探索阶段,此后主题为图书情报的研究快速发展。1998 年,王崇德论述了互联网使图书情报学的理论、曾理与操作、服务工作产生了怎么样的改变[27];2005 年,孙瑞英、毕强对内容分析法的相关内容进行了阐述,主要对内容分析法在图书情报领域的研究现状进行了分析,最后阐述了内容分析法在网络数据分析方面的应用前景和存在的弊端[28];2006 年,邱均平、段宇锋提出知识在图书情报学中领域中的地位越来越重要,学科研究多采用综合性的方法,研究方法的综合化趋势愈来愈鲜明[29];2007 年,舒正勇、贾空寒等人用计量学方法,选择 CNKI 作为来源数据库,对期刊论文的耦合情况进行统计,并充分地比较分析了耦合比率、藕荷强度、耦合最大论文、作者耦合这些数据,从中发现图书情报学研究的规律与特征[30];2014 年,张斌、贾茜通过对国内图书情报学期刊中的关键词进行统计分析,运用文献计量与聚类统计的方法,发现了国内图书情报学的知识分布与演化趋势。最后比较分析了国内外图书情报学的知识结构的异同[31];2015 年,吴丹、余文婷调查了 2010 年到 2014 年图书情报学教育现状,并对主要的发展趋势进行了总结[32];2018 年,史盛楠、李秀霞等人借助"二八定
【参考文献】:
期刊论文
[1]大学生信息素养的群体差异性分析[J]. 王雅静. 情报探索. 2018(12)
[2]2006—2016年管理科学与工程研究热点主题研究——基于LDA概率主题模型分析[J]. 陈植元,杨海霞,王先甲. 珞珈管理评论. 2018(04)
[3]基于LDA模型的主题演化分析:以情报学文献为例[J]. 朱茂然,王奕磊,高松,王洪伟,张晓鹏. 北京工业大学学报. 2018(07)
[4]基于CTM模型的学科间知识交流分析——以图书情报学和计算机信息科学间的知识交流为例[J]. 史盛楠,李秀霞,宋呈玉,谢瑞霞. 情报理论与实践. 2018(07)
[5]基于共词分析的我国图书情报学研究主题演化分析[J]. 陈淋,屈文建. 新世纪图书馆. 2017(12)
[6]基于共词分析法的学科主题演化研究方法的构建[J]. 唐果媛. 图书情报工作. 2017(23)
[7]基于结构方程的移动图书馆用户体验满意度模型研究[J]. 金小璞,毕新. 情报科学. 2017(11)
[8]引文分布视角下期刊评价的P指数研究[J]. 陈卫静,张宇娥,蔺梅芳. 图书情报工作. 2017(17)
[9]基于轨迹聚类的个性化信息服务策略[J]. 高亚瑞玺,汤珊红. 情报理论与实践. 2017(06)
[10]基于UMLS的肺癌治疗研究热点分析[J]. 宫小翠,安新颖,赵迎光. 中华医学图书情报杂志. 2017(01)
博士论文
[1]研究前沿识别与分析方法研究[D]. 冯佳.吉林大学 2017
硕士论文
[1]基于LDA的国内数字图书馆研究主题发现与演化[D]. 吴君麟.南昌大学 2017
[2]基于社会网络分析的医学领域主题演化探测研究[D]. 宫小翠.北京协和医学院 2017
[3]基于科学计量的我国图书情报学文献分析[D]. 李国安.山西大学 2016
[4]基于知识图谱的我国图书情报学发展研究[D]. 陈淋.南昌大学 2016
[5]中国典型管理期刊文献主题发现与演化分析[D]. 马秀敏.大连理工大学 2011
[6]基于LDA的主题演化研究与实现[D]. 崔凯.国防科学技术大学 2010
本文编号:3464159
【文章来源】:曲阜师范大学山东省
【文章页数】:51 页
【学位级别】:硕士
【部分图文】:
国外以LIS为研究方向的发文量
图 1-2 国内以主题演化为研究方向的发文量2004 年,邱均平教授等人以三种核心期刊作为数据统计分析的来源,采用内容分法,揭示了国内外 2003 年情报学重要研究领域,探索其未来发展趋向[19];2007 年,成教授等运用词频分析方法揭示了国内外知识管理研究的热点,并从多个方面进行了分析[20];2009 年,王萍选取三种国际教育技术期刊出版的文献作为研究对象,利用进行建模,并运用相似度这一指标进行测度,实现主题挖掘的目的[21];2009 年何静等一种客观赋权法—熵值法,揭示了电子学与信息系统学科研究热点,预测未来发展趋2012 年,王莉亚等为了探究信息整合主题演化情况,运用信息熵对来源数据进行分析,进而得到信息整合主题趋势[23];2013 年,李勇等运用相似度这一指标进行测度过观察主题在各个时间窗口内的变化,从主题偏移这一角度来探究主题演化趋势[24]。2014 年,胡吉明等采用增量 Gibbs 抽样估计算法对 LDA 模型进行了改进,构建LDA 主题模型,运用 LDA 主题模型进行主题发现,最后采用主题相似度和主题强度个指标探析主题演化情况[25];2017 年,程淋等人综合利用共词分析、聚类分析、战略图等科学计量方法动态分析了我国图书情报学在三个时间段的研究主题,发现图书情
图 1-3 国内以图书情报为主题的发文量我国图书情报—体化的历程始于 1978 年,1979 年至 1984 年处于探索阶段,此后主题为图书情报的研究快速发展。1998 年,王崇德论述了互联网使图书情报学的理论、曾理与操作、服务工作产生了怎么样的改变[27];2005 年,孙瑞英、毕强对内容分析法的相关内容进行了阐述,主要对内容分析法在图书情报领域的研究现状进行了分析,最后阐述了内容分析法在网络数据分析方面的应用前景和存在的弊端[28];2006 年,邱均平、段宇锋提出知识在图书情报学中领域中的地位越来越重要,学科研究多采用综合性的方法,研究方法的综合化趋势愈来愈鲜明[29];2007 年,舒正勇、贾空寒等人用计量学方法,选择 CNKI 作为来源数据库,对期刊论文的耦合情况进行统计,并充分地比较分析了耦合比率、藕荷强度、耦合最大论文、作者耦合这些数据,从中发现图书情报学研究的规律与特征[30];2014 年,张斌、贾茜通过对国内图书情报学期刊中的关键词进行统计分析,运用文献计量与聚类统计的方法,发现了国内图书情报学的知识分布与演化趋势。最后比较分析了国内外图书情报学的知识结构的异同[31];2015 年,吴丹、余文婷调查了 2010 年到 2014 年图书情报学教育现状,并对主要的发展趋势进行了总结[32];2018 年,史盛楠、李秀霞等人借助"二八定
【参考文献】:
期刊论文
[1]大学生信息素养的群体差异性分析[J]. 王雅静. 情报探索. 2018(12)
[2]2006—2016年管理科学与工程研究热点主题研究——基于LDA概率主题模型分析[J]. 陈植元,杨海霞,王先甲. 珞珈管理评论. 2018(04)
[3]基于LDA模型的主题演化分析:以情报学文献为例[J]. 朱茂然,王奕磊,高松,王洪伟,张晓鹏. 北京工业大学学报. 2018(07)
[4]基于CTM模型的学科间知识交流分析——以图书情报学和计算机信息科学间的知识交流为例[J]. 史盛楠,李秀霞,宋呈玉,谢瑞霞. 情报理论与实践. 2018(07)
[5]基于共词分析的我国图书情报学研究主题演化分析[J]. 陈淋,屈文建. 新世纪图书馆. 2017(12)
[6]基于共词分析法的学科主题演化研究方法的构建[J]. 唐果媛. 图书情报工作. 2017(23)
[7]基于结构方程的移动图书馆用户体验满意度模型研究[J]. 金小璞,毕新. 情报科学. 2017(11)
[8]引文分布视角下期刊评价的P指数研究[J]. 陈卫静,张宇娥,蔺梅芳. 图书情报工作. 2017(17)
[9]基于轨迹聚类的个性化信息服务策略[J]. 高亚瑞玺,汤珊红. 情报理论与实践. 2017(06)
[10]基于UMLS的肺癌治疗研究热点分析[J]. 宫小翠,安新颖,赵迎光. 中华医学图书情报杂志. 2017(01)
博士论文
[1]研究前沿识别与分析方法研究[D]. 冯佳.吉林大学 2017
硕士论文
[1]基于LDA的国内数字图书馆研究主题发现与演化[D]. 吴君麟.南昌大学 2017
[2]基于社会网络分析的医学领域主题演化探测研究[D]. 宫小翠.北京协和医学院 2017
[3]基于科学计量的我国图书情报学文献分析[D]. 李国安.山西大学 2016
[4]基于知识图谱的我国图书情报学发展研究[D]. 陈淋.南昌大学 2016
[5]中国典型管理期刊文献主题发现与演化分析[D]. 马秀敏.大连理工大学 2011
[6]基于LDA的主题演化研究与实现[D]. 崔凯.国防科学技术大学 2010
本文编号:3464159
本文链接:https://www.wllwen.com/tushudanganlunwen/3464159.html