基于LDA模型的图书情报学向计算机科学知识流动分析
【学位授予单位】:曲阜师范大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:G353.1
【图文】:
图 2-1 LD 模型概率公式图 2-1 为 LDA 模型概率公式图,“主题-词语”矩阵代表每个主题中每个词语出现“文档-主题”矩阵代表每个文档中的每个主题出现的概率。“文档-词语”矩阵代表中每个词语出现的概率。通过对大量文档进行分词工作,计算出每个词语出现在中的概率,如图中左侧文档-词语矩阵。LDA 模型作为无监督的学习模型,可以训练,获得例如图中右侧主题-词语和文档-主题矩阵。基于上述两个矩阵,可以下一步研究。D.M.Blei 使用的是 Mean Field Variational 推理算法,将主题-文档分布θ作为多维在随机变量,引入超参数α来生成参数,但只对文档-主题的混合参数加上了 Di,没有对主题-词语概率分布进行先验假设。T.L.Giffiths 则在文献中对主题-词语上加上先验,基于多项式分布和 Dirichlet 分布共轭特性,提出了 Gibbs 算法,并数 β 来生成参数,该模型原理见图 2-2。
图 2-2 LD 模型原理2 中,箭头代表依赖关系,矩形方框代表矩形方框内的内容进隐含参数和变量,实心节点表示可被观测值,由θ表示文档的主词分布的参数集合,每行代表某个主题的词项概率,α则表示档个数,K 表示主题数量;W 是关键词,W 的主题序号是 接计算出θ和φ,通常情况下需要借助最大似然估计来完成参数aritionalinference 算法、EM 算法、Gibbs 算法,Gibbs 因其较而得到广泛的应用。型的文档生成结果如表 2-1 所示。表 2-1 LDA 模型文档生成结果X.others保存与 LDA 模型相关参数X.phi保存词在主题下的概率分布矩阵
图 2-3 确定最优主题数目方法常用的 3 种方法来获取最优主题数目都存在一定的不足,本文选取开源软件不同主题数目下困惑度 (Perplexity) 的变化,来确定主题数目。开源软件 R软件 R 诞生于 1980 年左右,其统计分析和绘图功能都非常强大,具有很多值点:首先,它的开发周期较短,在 CRAN 库里包含有大量的函数包;其次,它
【相似文献】
相关期刊论文 前10条
1 钱思晨;肖龙翔;岑炅莲;;我国图书情报学数据素养教育内容及框架研究[J];图书馆研究;2019年03期
2 孟巍;;大数据驱动下的图书情报学科热点领域挖掘[J];农业图书情报学刊;2018年07期
3 刘波;;知识管理与图书情报学的变革[J];传媒论坛;2018年09期
4 姚川军;;大数据背景下图书情报学科人才培养模式研究[J];山东工业技术;2017年02期
5 ;欢迎订阅2018年度《农业图书情报学刊》[J];农业展望;2017年06期
6 刘忠宝;赵文娟;贾君枝;;深度学习及其对图书情报学的启示[J];情报工程;2017年04期
7 ;陕西省图书馆学会第十次图书情报学学术成果评奖结果揭晓[J];当代图书馆;2017年03期
8 汤敬谦;杨鹤林;;热点、网络与态势:国外图书情报学领域元数据研究的知识图谱分析[J];图书馆学研究;2016年06期
9 王红;白才进;雷菊霞;;智库视角下图书情报学学科发展范式和未来变革趋势[J];图书馆学研究;2016年13期
10 杨颖;;大数据背景下图书情报学科教学模式创新研究[J];魅力中国;2017年05期
相关会议论文 前7条
1 刘宇;张云中;魏瑞斌;谢欢;;2012-2013年上海图书情报学研究进展述评[A];上海学术报告(2012-2013)[C];2015年
2 李敏;;浅议图书情报学的可持续发展[A];山西省科技情报学会2004年学术年会论文集[C];2005年
3 陈福蓉;李建霞;;基于图书情报学的国家社科基金古籍保护立项分析[A];广西图书馆学会2012年年会暨第30次科学讨论会论文集[C];2012年
4 欧阳剑;周添良;胡雅琼;;“互联网+”视域下的我国图书情报学教育模式变革探析[A];中国图书馆学会年会论文集(2017年卷)[C];2018年
5 张尔君;;加强行业协会组织建设 助推图书情报事业发展——市地级图书情报学会发展思考[A];全国中小型公共图书馆联合会2015年研讨会会议论文集(一)[C];2015年
6 ;提升公众素养 造就文化强市[A];黑龙江省社科工作经验交流会材料汇编[C];2010年
7 杜娜;;浅议图书馆馆员的终身教育[A];新世界中国教育发展论坛 第二卷[C];2007年
相关重要报纸文章 前5条
1 湘潭大学公共管理学院 关影;从知识图谱视角看中外图书情报学科进展[N];新华书目报;2016年
2 图娃;图书情报学需建资格认证体系[N];中国社会科学报;2010年
3 中国科技信息研究所研究员 武夷山;不可忽视信息在文化产业中的作用[N];光明日报;2007年
4 实习生 李洪威 记者 张伟国;省社科院延边州分院成立[N];吉林日报;2009年
5 记者 李思辉 王才忠;学术繁荣有新篇[N];湖北日报;2013年
相关博士学位论文 前1条
1 程妮;基于引文的知识转移研究[D];武汉大学;2009年
相关硕士学位论文 前10条
1 倪弘;美国图书情报学研究生教育对中国的启示[D];山西财经大学;2019年
2 杜含双;期刊引证视角下图书情报学知识交流结构分析[D];西南科技大学;2019年
3 于娜;基于LDA模型的图书情报学向计算机科学知识流动分析[D];曲阜师范大学;2019年
4 于舒曼;基于共词聚类的图书情报学与新闻传播学学科交叉研究[D];曲阜师范大学;2019年
5 王佳佳;海峡两岸图书情报学领域博硕士学位论文对比研究[D];东北师范大学;2018年
6 郭骅祥;我国图书情报学学科交叉计量分析[D];郑州大学;2018年
7 刘敏;我国图书情报学学科交叉知识网络的构建及演化研究[D];曲阜师范大学;2018年
8 朱彦君;近十年图书情报学科学结构及演进研究[D];曲阜师范大学;2018年
9 李小北;图书情报学领域研究方法的效度研究[D];河北大学;2018年
10 武正谷;基于CiteSpace分析的我国图书情报学科发展研究[D];山西医科大学;2018年
本文编号:2777614
本文链接:https://www.wllwen.com/tushudanganlunwen/2777614.html