基于主题的学术网络构建
发布时间:2019-11-14 03:10
【摘要】:学术领域信息,如学术文献信息和作者信息等,是学术研究者持续关注的重点信息。深入挖掘学术领域信息,构建相关学术网络,对学术研究工作和学科发展有很大的意义。现有的大型专业数据库和搜索引擎提供的科技文献检索,对学术文献和作者的信息利用还远远不够,学术领域信息挖掘和利用存在着巨大的发展潜力。 从海量学术文献中,挖掘出文献之间的内在结构和发展脉络,对科学研究者有很大的帮助,如可以帮助研究者了解领域发展历程、当前领域研究热点以及研究主题可能发展趋势等等。本文从学术文献之间的内在主题一致性和发展演化性等角度,来挖掘出文献之间的内在结构和脉络,最终构建基于主题的学术网络。具体说来,本文主要完成以下工作: 1、本文提出一种构建学术网络的方法,即采用分而治之的策略,先将学术网络进行群体划分,并对群体之间的关系进行描述,然后对每一个群体构建详细的学术群体网络图。 2、在学术群体划分中,引入张量分解的方法,该方法能够对海量复杂结构的超图进行分解,具有很强的扩展性,且时间复杂度低,适用于大规模数据的学术群体发现。同时,综合对比聚类、动态主题模型和张量分解三种不同的方法在群体划分过程中的效果和性能。三种方法采用学术领域不同的信息,取得不同的划分效果,能够适用于不同的应用场景。 3、在构建学术群体网络时,采用关键文章和主题路径生成结合的方法,该方法易于实现,在实验中取得了一定的效果。其中基于主题的路径生成方法可以解决最短路径方法等生成路径主题不一致、存在局部相似性等问题,为生成学术网络提供了主题演化特性和脉络特征,同时对现有的学术文献索引方式提供了一种可行的主题特性。 4、搭建了生成基于主题学术网络的系统,提供文章信息收集与整合、数据存储与访问、学术网络核心算法以及Web访问接口定义等功能,能够自动收集学术信息,并处理生成最终目标网络。
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.09;TP391.1
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP393.09;TP391.1
【共引文献】
相关期刊论文 前10条
1 栗晓聪;滕少华;;频繁项集挖掘的Apriori改进算法研究[J];江西师范大学学报(自然科学版);2011年05期
2 陆静;;k-means算法在电信客户关系管理中的应用[J];福建电脑;2012年08期
3 翟淑伟;石奇光;杨燕玲;金蓉;霍焕广;;火电厂运行状态监测数据挖掘技术综述[J];华东电力;2012年02期
4 管仁初;裴志利;时小虎;杨晨;梁艳春;;权吸引子传播算法及其在文本聚类中的应用[J];计算机研究与发展;2010年10期
5 童先群;周忠眉;;基于属性值信息熵的KNN改进算法[J];计算机工程与应用;2010年03期
6 王影;王浩;俞奎;姚宏亮;;基于L1正则化的贝叶斯网络分类器[J];计算机科学;2012年01期
7 杨宇舟;张凤荔;王勇;;基于K-MEANS聚类的分支定界算法在网络异常检测中的应用[J];计算机科学;2012年04期
8 徐晶;刘旭敏;关永;董睿;;基于条件误分类的决策树剪枝算法[J];计算机工程;2010年23期
9 周靖;刘晋胜;;基于特征熵相关度差异的KNN算法[J];计算机工程;2011年17期
10 翟鸿雁;曾晋明;曾纪霞;;基于支持向量机的电力市场价格预测中的核函数比较[J];计算技术与自动化;2011年02期
相关会议论文 前3条
1 陈清光;许家佗;于波;郭U喦,
本文编号:2560625
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2560625.html