当前位置:主页 > 社科论文 > 图书档案论文 >

基于科技文献的时序主题链构建方法研究

发布时间:2020-06-22 10:59
【摘要】:科技文献是科学研究和技术研究成果的最终形式之一,是传递情报信息和交流学术思想的重要载体。阅读科技文献是科研人员获取知识的重要渠道,也是科研人员进行学术研究和科学决策的重要基础。主题是科技文献内容的提示符,是文献所包含的学术思想及学术观点的凝练和总结。主题是随着时间不断演化的,演化过程包括新主题的产生、旧主题的消亡、某个主题向其他主题的渗透或收敛等现象。展示科技文献中主题的演化过程有助于科研人员把握研究的脉络,并辅助科研人员进行科学决策。 本研究以主题演化分析为主线,用时序主题链的方式来展现科技文献中主题随时间变化的事实。提出了时序主题链的模型和构建方法,并基于科技文献进行了实证研究,而且对实证研究中的主题交叉融合特征进行了量化研究。 第一,针对带有时间标签的文本集合,提出了时序主题链模型及其构建方法。将互信息的思想引入主题词的提取过程,以更好的表示主题含义;考虑到新主题更容易、更快地传承下去,在构建转移概率公式时引入了衰减因子,并利用艾宾浩斯遗忘规律进行度量;构建时序主题链时,搜索各个主题的来源和去向,以完整的展示主题的发展脉络。 第二,针对科技文献数据,利用所提出的时序主题链构建方法进行实证研究。结果表明,时序主题链可以展示主题随时间变化的过程,并能揭示主题演化过程中不同主题间的隐含关系。 第三,以实证研究中的时序主题链为研究对象,分析主题演化过程中的交叉融合特征,并提出量化方法。时序主题链中存在融合式结构,此结构能揭示不同主题相互渗透、相互作用的交叉融合特征。为研究不同主题间发生交叉融合的概率大小或难易程度,利用融合式结构对主题融合度进行量化。 时序主题链可以揭示文献中各个主题的发展脉络和不同主题间隐含的关系,主题交叉融合特征分析有助于发现创新切入点和解决问题的思路,对科研人员具有重要的引导和启示意义。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:G353.1;G354

【参考文献】

相关期刊论文 前10条

1 文庭孝;刘晓英;;中文文本解构与知识发现研究[J];图书与情报;2009年03期

2 潘大庆;;基于层次聚类的微博敏感话题检测算法研究[J];广西民族大学学报(自然科学版);2012年04期

3 刘向;马费成;;科学知识网络的演化与动力——基于科学引证网络的分析[J];管理科学学报;2012年01期

4 崔凯;周斌;贾焰;梁政;;一种基于LDA的在线主题演化挖掘模型[J];计算机科学;2010年11期

5 梁立明,谢彩霞;词频分析法用于我国纳米科技研究动向分析[J];科学学研究;2003年02期

6 丁X;李鑫;;我国知识管理研究主题变化的计量分析[J];科学学研究;2008年02期

7 岳洪江;;管理科学知识扩散网络的结构研究[J];科学学研究;2008年04期

8 岳洪江;刘思峰;梁立明;;我国对技术创新的关注与研究——基于24年的文献计量分析[J];科研管理;2008年03期

9 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期

10 单斌;李芳;;基于LDA话题演化研究方法综述[J];中文信息学报;2010年06期

相关硕士学位论文 前5条

1 马秀敏;中国典型管理期刊文献主题发现与演化分析[D];大连理工大学;2011年

2 贺亮;基于话题模型的科技文献话题发现与趋势分析[D];上海交通大学;2012年

3 骆国靖;基于主题模型的模块化网络和社区挖掘研究[D];浙江大学;2008年

4 王燕霞;基于相关主题模型的文本分类方法研究[D];苏州大学;2010年

5 楚克明;基于LDA的新闻话题演化研究[D];上海交通大学;2010年



本文编号:2725587

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2725587.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户701a3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com