基于潜在主题的交叉学科知识组合与知识传播研究
发布时间:2020-12-27 12:39
近现代科学发展过程伴随着科学的不断分化的同时,亦涌现出一些打破学科界限或研究领域边界的科学研究活动,并逐步发展成为交叉学科。交叉学科研究已成为现代科学发展的主要方向之一,属于科学的前沿领域。在此背景下,研究交叉学科知识创新规律和运行机制将有助于进一步促进交叉学科繁荣发展。从本质来看,交叉学科中的知识创新是相关基础学科知识输入、组合、融汇的结果。对交叉学科的知识组合结构和知识传播进行研究,能从创新源头上剖析交叉学科的运行机制,揭示交叉学科发展规律。鉴于此,本研究将从交叉学科研究文献内容中识别出潜在的研究主题,以主题为视角,通过挖掘主题之间的联系,揭示交叉学科中知识组合和知识传播的结构和规律,以窥探交叉学科运行规律。本文研究以主题为切入视角,剖析交叉学科中的知识组合和知识传播结构。文章首先提出构建整合交叉学科和基础学科研究文献的集成数据集,从中识别出交叉学科中的潜在主题。接着,文章从两个分析路径剖析主题之间的相互关系:一是主题之间的共现关系。文章假设科学文献中的主题共现是一种知识组合的反映,在此假设基础上,通过构建主题共现网络研究了交叉学科中的知识组合结构以及跨学科知识组合模式;二是主题之...
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:147 页
【学位级别】:博士
【部分图文】:
图2-4.概率潜在语义索引的图模型??
它能自动地发现文档集中的潜在主题结构。与潜在语义索引和概率潜在索引类似,??LDA模型的输入是文档-词项矩阵,输出结果是主题词项概率分布和文档主题概率分布两种分??布。根据图2-5所示的直观解释做如下形式化定义:LDA主题模型的基本假设是文本集中存在??着K个潜在主题,而单篇文本是这K个主题的概率分布,即在单篇文本中,主题z具有不同的概??率值P(z|d)。同时,主题z可以表达为一元语言模型,即词项的概率分布——词项w拥有一个??概率值PUIZ)。LDA模型的概率图模型进行表示见图2-7。??(!)?,??0—???Nd_???D_??图2-7丄DA的概率图表示???在该图所示的LDA模型中,D代表整个语料库中有D篇文档,w为词变量,1^表示文档c/中??的词项数量,z为主题变量,表示标示词w所属的主题,9为某文档的主题概率分布,0表示主??题词项概率分布,它可以表达为一个K?XV的矩阵,其中K为预设的主题个数,V为词项空间中的??词数量。a是文档主题概率分布0的超参数,可以理解为狄利克雷分布的先验参数。a值越大,??^lei?D?M
论文也拥有了主题&然后在该主题的词项概率分布0基础上生成一个这个单词w;重复以上过??程直至完成这篇论文的写作。??作者主题模型的这一过程可以采用概率图模型表示方法呈现,如图2-8所示。作者主题模型??的概率图模型与LDA模型的差别是引入了可观察变量——论文d的所有作者,以及不可观察变??量——作者x,主题的生成同时受到作者和作者主题分布影响。而其他部分与LDA模型相似。??〇?G)???—〇—?????Nd]???D_??图2_8.作者主题模型的概率图模型??与LDA模型类似,可以釆用整个文本集的生成过程琰描述作者主题模型:??①初始化作者主题分布和主题词项分布;???Rosen-Zvi?M,?Chemudugunta?C,?Griffiths?T,?et?al.?Learning?author-topic?models?from?text?corpora[J].?ACM??Transactions?on?Information?Systems,?2010,?28(1):?1-38.???Rosen-ZviM,?Griffiths?T,?Ste^ers?M,?et?al.?The?author-topic?model?for?authors?and?documents[C]//Proceedings?of?the??20th?conference?on?Uncertainty?in?artificial?intelligence.?AUAI?Press,?2004:?487-494.??30??
【参考文献】:
期刊论文
[1]不同语料下基于LDA主题模型的科学文献主题抽取效果分析[J]. 关鹏,王曰芬,傅柱. 图书情报工作. 2016(02)
[2]LDA主题模型研究综述[J]. 祖弦,谢飞. 合肥师范学院学报. 2015(06)
[3]基于LDA的科技创新主题语义识别研究[J]. 祝娜,王效岳,杨京,白如江. 图书情报工作. 2015(14)
[4]一个跨学科性测度指标:作者专业度[J]. 和晋飞,房俊民. 情报理论与实践. 2015(05)
[5]中国图书情报学跨学科知识交流特征研究——基于CCD数据库的分析[J]. 王旻霞,赵丙军. 情报理论与实践. 2015(05)
[6]科研人员论文引用动机及相互影响关系研究[J]. 邱均平,陈晓宇,何文静. 图书情报工作. 2015(09)
[7]基于引文耦合和概念格的学科交叉知识结构探测[J]. 邵作运,李秀霞. 图书情报工作. 2015(08)
[8]原始性创新中的创新技法研究[J]. 陈雅兰,戴顺治,郑琳琳,卢忠鸣,黄锨. 科学学研究. 2015(04)
[9]基于SNA的学科交叉研究主题分析——以情报学与计算机科学为例[J]. 李长玲,郭凤娇,支岭. 情报科学. 2014(12)
[10]跨学科行动计划下的合作演进特征测度——以TREC1为例[J]. 代君,叶艳. 图书情报知识. 2014(06)
硕士论文
[1]基于引文分析法的学科关联分析[D]. 蔡璐.上海师范大学 2011
[2]共现分析在文本知识挖掘中的应用研究[D]. 宋爽.南京理工大学 2006
本文编号:2941750
【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校
【文章页数】:147 页
【学位级别】:博士
【部分图文】:
图2-4.概率潜在语义索引的图模型??
它能自动地发现文档集中的潜在主题结构。与潜在语义索引和概率潜在索引类似,??LDA模型的输入是文档-词项矩阵,输出结果是主题词项概率分布和文档主题概率分布两种分??布。根据图2-5所示的直观解释做如下形式化定义:LDA主题模型的基本假设是文本集中存在??着K个潜在主题,而单篇文本是这K个主题的概率分布,即在单篇文本中,主题z具有不同的概??率值P(z|d)。同时,主题z可以表达为一元语言模型,即词项的概率分布——词项w拥有一个??概率值PUIZ)。LDA模型的概率图模型进行表示见图2-7。??(!)?,??0—???Nd_???D_??图2-7丄DA的概率图表示???在该图所示的LDA模型中,D代表整个语料库中有D篇文档,w为词变量,1^表示文档c/中??的词项数量,z为主题变量,表示标示词w所属的主题,9为某文档的主题概率分布,0表示主??题词项概率分布,它可以表达为一个K?XV的矩阵,其中K为预设的主题个数,V为词项空间中的??词数量。a是文档主题概率分布0的超参数,可以理解为狄利克雷分布的先验参数。a值越大,??^lei?D?M
论文也拥有了主题&然后在该主题的词项概率分布0基础上生成一个这个单词w;重复以上过??程直至完成这篇论文的写作。??作者主题模型的这一过程可以采用概率图模型表示方法呈现,如图2-8所示。作者主题模型??的概率图模型与LDA模型的差别是引入了可观察变量——论文d的所有作者,以及不可观察变??量——作者x,主题的生成同时受到作者和作者主题分布影响。而其他部分与LDA模型相似。??〇?G)???—〇—?????Nd]???D_??图2_8.作者主题模型的概率图模型??与LDA模型类似,可以釆用整个文本集的生成过程琰描述作者主题模型:??①初始化作者主题分布和主题词项分布;???Rosen-Zvi?M,?Chemudugunta?C,?Griffiths?T,?et?al.?Learning?author-topic?models?from?text?corpora[J].?ACM??Transactions?on?Information?Systems,?2010,?28(1):?1-38.???Rosen-ZviM,?Griffiths?T,?Ste^ers?M,?et?al.?The?author-topic?model?for?authors?and?documents[C]//Proceedings?of?the??20th?conference?on?Uncertainty?in?artificial?intelligence.?AUAI?Press,?2004:?487-494.??30??
【参考文献】:
期刊论文
[1]不同语料下基于LDA主题模型的科学文献主题抽取效果分析[J]. 关鹏,王曰芬,傅柱. 图书情报工作. 2016(02)
[2]LDA主题模型研究综述[J]. 祖弦,谢飞. 合肥师范学院学报. 2015(06)
[3]基于LDA的科技创新主题语义识别研究[J]. 祝娜,王效岳,杨京,白如江. 图书情报工作. 2015(14)
[4]一个跨学科性测度指标:作者专业度[J]. 和晋飞,房俊民. 情报理论与实践. 2015(05)
[5]中国图书情报学跨学科知识交流特征研究——基于CCD数据库的分析[J]. 王旻霞,赵丙军. 情报理论与实践. 2015(05)
[6]科研人员论文引用动机及相互影响关系研究[J]. 邱均平,陈晓宇,何文静. 图书情报工作. 2015(09)
[7]基于引文耦合和概念格的学科交叉知识结构探测[J]. 邵作运,李秀霞. 图书情报工作. 2015(08)
[8]原始性创新中的创新技法研究[J]. 陈雅兰,戴顺治,郑琳琳,卢忠鸣,黄锨. 科学学研究. 2015(04)
[9]基于SNA的学科交叉研究主题分析——以情报学与计算机科学为例[J]. 李长玲,郭凤娇,支岭. 情报科学. 2014(12)
[10]跨学科行动计划下的合作演进特征测度——以TREC1为例[J]. 代君,叶艳. 图书情报知识. 2014(06)
硕士论文
[1]基于引文分析法的学科关联分析[D]. 蔡璐.上海师范大学 2011
[2]共现分析在文本知识挖掘中的应用研究[D]. 宋爽.南京理工大学 2006
本文编号:2941750
本文链接:https://www.wllwen.com/tushudanganlunwen/2941750.html