当前位置:主页 > 社科论文 > 图书档案论文 >

基于LDA模型的图书情报学向计算机科学知识流动分析

发布时间:2020-08-01 14:56
【摘要】:随着学科融合的不断深化以及技术手段的日新月异,科学研究在逐渐打破学科原有界限,朝着学科交叉融合的方向迈进,这为图书情报学的发展提供了良好的外部环境。长期以来,图书情报学与计算机科学间的学术交流极为密切,图书情报学在吸收计算机科学的理论方法,服务于自身学科建设发展的同时,也在为计算机科学的发展贡献出自己的一份力量。分析学科间知识流动已有研究,发现对于学科间知识流动研究缺乏在主题层次上的分析,以主题为切入视角对图书情报学学科向计算机科学学科的知识流动状况进行理论与实践相结合的分析,有利于客观准确地把握图书情报学学科向计算机科学学科的知识流动脉络,促进学科的学术创新、提高学术产出的质量。本文调查分析了国内外学科间知识流动的相关文献以及图书情报学与计算机科学的相关文献,将引文内容分析法与全文本引文分析法相结合进行实践研究,借助R、Endnote、Excel以及Notepad++软件工具对文献数据、困惑度、主题强度及主题分布、热点主题进行了数据统计分析,通过LDA模型对学科文献内容进行主题建模,挖掘被计算机科学引用的图书情报学文献主题以及计算机科学的施引文献主题,有助于深入理解学科间的知识流动过程。本文首先在调研了国内外学科间知识流动研究现状基础之上,提出了以主题为切入视角探索学科间知识流动过程。其次,介绍了LDA模型以及知识流动的相关概念,从知识转移和知识转化的角度分析了知识流动的过程,将知识转移与知识转化过程视为知识流动的完成过程,类比学科间知识流动过程,分析并构建了基于主题的学科间知识流动模式。再次,以Web of Science为数据来源,检索了近五年图书情报学与计算机科学文献,获取图书情报学与计算机科学文献的相关数据,通过开源软件R进行数据处理与主题困惑度分析,确定LDA模型的最优主题数目,并对LDA模型提取的主题进行主题强度度量,分析了图书情报学向计算机科学知识转移与计算机科学知识转化后相关文献的研究主题分布以及热点主题。最后,基于知识流动理论并结合图书情报学与计算机科学的相关文献研究分析,提出了促进图书情报学向计算机科学知识流动的针对性策略。研究发现,图书情报学向计算机科学知识转移主要集中在20个主题,分为五个研究方向:信息技术类研究、技术方法类研究、用户类研究、社会热点话题类研究、学术文献类研究,热点主题包括科学引文分析、信息检索、用户模型研究、企业组织管理研究、电子医疗研究。计算机科学知识转化后主要集中在15个主题,分为四个研究方向:用户类研究、社会热点话题类研究、管理类研究、技术方法类研究,热点主题包括用户意愿感知研究、机器学习、电子医疗研究、大数据处理与分析以及自然语言处理。
【学位授予单位】:曲阜师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G353.1
【图文】:

概率分布,模型概率,公式,词语


图 2-1 LD 模型概率公式图 2-1 为 LDA 模型概率公式图,“主题-词语”矩阵代表每个主题中每个词语出现“文档-主题”矩阵代表每个文档中的每个主题出现的概率。“文档-词语”矩阵代表中每个词语出现的概率。通过对大量文档进行分词工作,计算出每个词语出现在中的概率,如图中左侧文档-词语矩阵。LDA 模型作为无监督的学习模型,可以训练,获得例如图中右侧主题-词语和文档-主题矩阵。基于上述两个矩阵,可以下一步研究。D.M.Blei 使用的是 Mean Field Variational 推理算法,将主题-文档分布θ作为多维在随机变量,引入超参数α来生成参数,但只对文档-主题的混合参数加上了 Di,没有对主题-词语概率分布进行先验假设。T.L.Giffiths 则在文献中对主题-词语上加上先验,基于多项式分布和 Dirichlet 分布共轭特性,提出了 Gibbs 算法,并数 β 来生成参数,该模型原理见图 2-2。

模型原理


图 2-2 LD 模型原理2 中,箭头代表依赖关系,矩形方框代表矩形方框内的内容进隐含参数和变量,实心节点表示可被观测值,由θ表示文档的主词分布的参数集合,每行代表某个主题的词项概率,α则表示档个数,K 表示主题数量;W 是关键词,W 的主题序号是 接计算出θ和φ,通常情况下需要借助最大似然估计来完成参数aritionalinference 算法、EM 算法、Gibbs 算法,Gibbs 因其较而得到广泛的应用。型的文档生成结果如表 2-1 所示。表 2-1 LDA 模型文档生成结果X.others保存与 LDA 模型相关参数X.phi保存词在主题下的概率分布矩阵

主题,数目,方法,困惑度


图 2-3 确定最优主题数目方法常用的 3 种方法来获取最优主题数目都存在一定的不足,本文选取开源软件不同主题数目下困惑度 (Perplexity) 的变化,来确定主题数目。开源软件 R软件 R 诞生于 1980 年左右,其统计分析和绘图功能都非常强大,具有很多值点:首先,它的开发周期较短,在 CRAN 库里包含有大量的函数包;其次,它

【相似文献】

相关期刊论文 前10条

1 钱思晨;肖龙翔;岑炅莲;;我国图书情报学数据素养教育内容及框架研究[J];图书馆研究;2019年03期

2 孟巍;;大数据驱动下的图书情报学科热点领域挖掘[J];农业图书情报学刊;2018年07期

3 刘波;;知识管理与图书情报学的变革[J];传媒论坛;2018年09期

4 姚川军;;大数据背景下图书情报学科人才培养模式研究[J];山东工业技术;2017年02期

5 ;欢迎订阅2018年度《农业图书情报学刊》[J];农业展望;2017年06期

6 刘忠宝;赵文娟;贾君枝;;深度学习及其对图书情报学的启示[J];情报工程;2017年04期

7 ;陕西省图书馆学会第十次图书情报学学术成果评奖结果揭晓[J];当代图书馆;2017年03期

8 汤敬谦;杨鹤林;;热点、网络与态势:国外图书情报学领域元数据研究的知识图谱分析[J];图书馆学研究;2016年06期

9 王红;白才进;雷菊霞;;智库视角下图书情报学学科发展范式和未来变革趋势[J];图书馆学研究;2016年13期

10 杨颖;;大数据背景下图书情报学科教学模式创新研究[J];魅力中国;2017年05期

相关会议论文 前7条

1 刘宇;张云中;魏瑞斌;谢欢;;2012-2013年上海图书情报学研究进展述评[A];上海学术报告(2012-2013)[C];2015年

2 李敏;;浅议图书情报学的可持续发展[A];山西省科技情报学会2004年学术年会论文集[C];2005年

3 陈福蓉;李建霞;;基于图书情报学的国家社科基金古籍保护立项分析[A];广西图书馆学会2012年年会暨第30次科学讨论会论文集[C];2012年

4 欧阳剑;周添良;胡雅琼;;“互联网+”视域下的我国图书情报学教育模式变革探析[A];中国图书馆学会年会论文集(2017年卷)[C];2018年

5 张尔君;;加强行业协会组织建设 助推图书情报事业发展——市地级图书情报学会发展思考[A];全国中小型公共图书馆联合会2015年研讨会会议论文集(一)[C];2015年

6 ;提升公众素养 造就文化强市[A];黑龙江省社科工作经验交流会材料汇编[C];2010年

7 杜娜;;浅议图书馆馆员的终身教育[A];新世界中国教育发展论坛 第二卷[C];2007年

相关重要报纸文章 前5条

1 湘潭大学公共管理学院 关影;从知识图谱视角看中外图书情报学科进展[N];新华书目报;2016年

2 图娃;图书情报学需建资格认证体系[N];中国社会科学报;2010年

3 中国科技信息研究所研究员 武夷山;不可忽视信息在文化产业中的作用[N];光明日报;2007年

4 实习生 李洪威 记者 张伟国;省社科院延边州分院成立[N];吉林日报;2009年

5 记者 李思辉 王才忠;学术繁荣有新篇[N];湖北日报;2013年

相关博士学位论文 前1条

1 程妮;基于引文的知识转移研究[D];武汉大学;2009年

相关硕士学位论文 前10条

1 倪弘;美国图书情报学研究生教育对中国的启示[D];山西财经大学;2019年

2 杜含双;期刊引证视角下图书情报学知识交流结构分析[D];西南科技大学;2019年

3 于娜;基于LDA模型的图书情报学向计算机科学知识流动分析[D];曲阜师范大学;2019年

4 于舒曼;基于共词聚类的图书情报学与新闻传播学学科交叉研究[D];曲阜师范大学;2019年

5 王佳佳;海峡两岸图书情报学领域博硕士学位论文对比研究[D];东北师范大学;2018年

6 郭骅祥;我国图书情报学学科交叉计量分析[D];郑州大学;2018年

7 刘敏;我国图书情报学学科交叉知识网络的构建及演化研究[D];曲阜师范大学;2018年

8 朱彦君;近十年图书情报学科学结构及演进研究[D];曲阜师范大学;2018年

9 李小北;图书情报学领域研究方法的效度研究[D];河北大学;2018年

10 武正谷;基于CiteSpace分析的我国图书情报学科发展研究[D];山西医科大学;2018年



本文编号:2777614

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2777614.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户46a1d***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com