基于社群发现的学术文献推荐系统的设计与实现
本文关键词:基于社群发现的学术文献推荐系统的设计与实现,由笔耕文化传播整理发布。
【摘要】:近年来,学术搜索引擎在科学研究活动中扮演着越来越重要的角色。学术搜索的一个重要问题是文献推荐。其主要任务是向用户推荐研究领域中最有价值的文献。在本文中,我们利用文献作者之间的合作关系以及文献之间的引用关系,通过结构分析来发现隐藏的相关文献,并推荐给用户。基于对引用-合作网络进行社群划分,我们提出了两种排序算法,分别是自适应算法和随机游走算法,这两种算法综合考虑了文本相似度、作者相似度、邻近度、影响力等多种因素来进行文献推荐。同时,基于微软学术的公开论文引用数据集,实现了一个文献推荐系统。我们招募了20名志愿者来对我们的算法进行性能评估。实验结果表明,我们提出的论文推荐算法优于PageRank等传统的搜索引擎算法。最后,我们通过实验验证了算法的效率,适用于大型的学术搜索引擎。
【关键词】:学术搜索 文献推荐 社交网络 引用-合作网络 社群发现
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3
【目录】:
- 摘要4-5
- Abstract5-11
- 第一章 绪论11-17
- 1.1 引言11-12
- 1.2 研究背景12-14
- 1.2.1 学术搜索引擎12
- 1.2.2 社群分析12-13
- 1.2.3 复杂图13-14
- 1.3 研究动机14-15
- 1.4 本文主要工作15-16
- 1.5 本文组织结构16-17
- 第二章 相关工作17-26
- 2.1 搜索引擎17-18
- 2.2 社群分析18-21
- 2.2.1 GN算法18-19
- 2.2.2 层次聚类算法19-20
- 2.2.3 模块化度20
- 2.2.4 标记传播算法20-21
- 2.2.5 机器学习算法21
- 2.3 复杂网络21-24
- 2.3.1 复杂网络的定义21-23
- 2.3.2 复杂网络中的社群发现23-24
- 2.4 全文检索24-26
- 第三章 基于引用-合作网络社群分析的文献推荐算法26-38
- 3.1 引用-合作网络26-27
- 3.2 问题描述27-29
- 3.3 算法思想29
- 3.4 社群发现29-33
- 3.4.1 图的转化30-31
- 3.4.2 带权重的标记传播算法31-33
- 3.5 在线检索排序33-38
- 3.5.1 自适应的排序算法34-35
- 3.5.2 随机游走算法35-38
- 第四章 学术论文推荐系统的设计与实现38-51
- 4.1 数据集38
- 4.2 文本相似度38-39
- 4.3 实验设计与实现39-40
- 4.4 数据持久化模块40-42
- 4.5 索引构建模块42-46
- 4.5.1 提供源文件42
- 4.5.2 分词器处理42-43
- 4.5.3 语言处理组件处理43
- 4.5.4 索引组件处理43-45
- 4.5.5 对索引的查询45-46
- 4.6 图的构建模块46-47
- 4.7 社群发现模块47-48
- 4.8 排序策略模块48
- 4.9 个性化信息显示模块48
- 4.10 图形界面48-50
- 4.11 本章小结50-51
- 第五章 性能分析与评估51-57
- 5.1 PageRank算法51
- 5.2 对比试验51-52
- 5.3 系统参数52
- 5.4 性能分析52-57
- 第六章 总结与展望57-58
- Bibliography58-61
- 简历与科研成果61-62
- 致谢62-63
【相似文献】
中国期刊全文数据库 前10条
1 ;万方学术搜索系统[J];现代图书情报技术;2011年03期
2 揭平毅;;谷歌高级学术搜索的应用探究[J];价值工程;2012年05期
3 颜世伟;;搜索引擎的学术搜索服务及其影响分析[J];大学图书情报学刊;2007年01期
4 陈家翠;谷玉荣;;Google学术搜索检索性能的分析及评价[J];情报理论与实践;2007年05期
5 饶安平;;Google学术搜索及其在课题检索中的应用[J];图书馆工作与研究;2010年08期
6 马彩峰;;Google学术搜索的信息组织探究[J];情报杂志;2010年S1期
7 董文鸳;;我国谷歌学术搜索研究综述[J];新世纪图书馆;2011年09期
8 于爱华;;高校数据库利用实例:读秀学术搜索的探讨[J];黑龙江科技信息;2012年14期
9 许剑颖;;微软学术搜索初探[J];情报探索;2012年12期
10 孟晓青;;高职院校超星移动图书馆“读秀”学术搜索的应用与推广研究[J];中国科教创新导刊;2014年13期
中国重要报纸全文数据库 前2条
1 本报记者 薛海滨 贾鹏雷;学术搜索“不学有术”[N];计算机世界;2006年
2 本报记者 陈静;搜索巨头瞄准细分市场[N];经济日报;2006年
中国硕士学位论文全文数据库 前1条
1 王琦森;基于社群发现的学术文献推荐系统的设计与实现[D];南京大学;2016年
本文关键词:基于社群发现的学术文献推荐系统的设计与实现,由笔耕文化传播整理发布。
,本文编号:267108
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/267108.html