面向科学研究主题的文献隐含时间信息分析与挖掘
发布时间:2018-04-01 09:12
本文选题:标签主题模型 切入点:隐含时间特征 出处:《情报学报》2017年04期
【摘要】:本研究针对缺乏检索对象时间范围和精确语义表达式的用户弱信息检索需求,为了更好地体现出文献之间的时间关联性,提出了一种文本内容时间信息的分析和挖掘方法。本文归纳总结了学术文献常用时间词,并基于图书情报学题录信息完成文本时间词抽取。在此基础上利用标签主题模型1abe1ed-LDA实现文本隐含时间标签的生成,以及基于时间维度的文本语义相似度计算。实验结果表明,本研究能较好地生成文献隐含时间信息,也能更有效地帮助用户提高弱信息检索结果的相关性。
[Abstract]:In order to better reflect the temporal relevance of literature, a method for analyzing and mining temporal information of text content is proposed in this study, aiming at the weak information retrieval needs of users who lack the time range of retrieval objects and accurate semantic expressions.This paper sums up the time words commonly used in academic literature, and completes the extraction of text time words based on the information of library and information science inscription.On this basis, the label topic model (1abe1ed-LDA) is used to realize the generation of text implicit time label and the text semantic similarity calculation based on time dimension.The experimental results show that this study can not only generate the implicit time information of literature, but also help users to improve the correlation of weak information retrieval results.
【作者单位】: 南京理工大学;武汉理工大学中国应急管理研究中心;
【基金】:国家自然科学基金青年项目“基于时间感知模型的学术主题检索与演化挖掘研究”(71503124);国家自然科学基金项目“突发事件网络舆情演变过程中的人群仿真研究”(71273132)
【分类号】:G353.1
【相似文献】
相关期刊论文 前10条
1 刘剑兰;用信息萃取进行文本挖掘的方法[J];情报杂志;2004年12期
2 夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;2005年03期
3 刘春艳;;基于信息可视化的文本挖掘研究领域前沿与演化分析[J];图书情报工作;2011年S2期
4 范并思;;组织者的话[J];图书情报工作;2012年08期
5 肖建国;;试论文本挖掘及其应用[J];图书馆学研究;2008年04期
6 徐海霞;聚类分析在Web文本挖掘中的应用[J];情报杂志;2004年12期
7 王连军;Web文本挖掘浅析[J];现代图书情报技术;2002年06期
8 韩客松,王永成;文本挖掘、数据挖掘和知识管理——二十一世纪的智能信息处理[J];情报学报;2001年01期
9 谌志群;张国煊;;文本挖掘与中文文本挖掘模型研究[J];情报科学;2007年07期
10 刘进锋;荣冈;;Web文本挖掘在辅助研究中的应用[J];情报科学;2006年03期
,本文编号:1694891
本文链接:https://www.wllwen.com/tushudanganlunwen/1694891.html
教材专著