专家发现平台下搜索引擎的设计与实现
发布时间:2023-04-25 02:00
随着地区经济增长速度放缓,区域创新与转型已成为突破区域发展瓶颈的重要方向。而专家作为掌握最新学术知识与人才渠道的人,能够对政府及企业进行指导建议,输送人才,是区域创新中的重要角色。在实际的推动区域创新过程中,政府企业面对的主要问题就是如何在大量的学术数据中,定位满足需求的专家信息。由于缺少可靠准确的信息源支持,政府与企业不能准确找到所需的专家人才,阻碍了区域创新发展。而专家信息的主要体现就是学术成果,通过获取专家发表的学术论文数据,分析专家的领域特征,构建出专家搜索引擎,就能够帮助政府企业定位专家,推动区域创新发展。为了设计并实现专家搜索引擎,本文首先从知网获取专家论文数据作为文本语料数据,主要的研究工作包括:根据专家论文数据特征,研究专家检索方法,引入作者主题模型,建立作者主题关系,并结合传统的语言查询模型,确定专家相关性的混合查询模型;使用改进的PageRank网页排序方法,进行专家重要性的排序;综合相关性查询模型和重要性排序模型,作为专家搜索引擎的检索模型;处理专家论文数据,并依照专家查询模型,分别计算生成了语言模型倒排索引和作者主题模型倒排索引,存储索引数据,为专家搜索引擎提供...
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
缩略词表
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 专家检索研究现状
1.2.2 研究现状小结
1.3 论文研究内容
1.4 论文组织结构
第二章 相关技术
2.1 搜索引擎相关概念
2.1.1 垂直搜索引擎的定义
2.1.2 垂直搜索引擎的特点
2.1.3 垂直搜索引擎的结构组成
2.2 搜索引擎技术
2.2.1 网络爬虫
2.2.2 倒排索引
2.2.3 链接分析
2.3 本章小结
第三章 专家检索方法
3.1 语言查询模型
3.2 主题查询模型
3.2.1 主题模型
3.2.2 作者主题模型
3.2.3 基于作者主题模型的查询方法
3.3 ExpertRank方法
3.3.1 PageRank
3.3.2 ExpertRank
3.3.3 算法设计与实现
3.4 综合查询方法
3.5 本章小结
第四章 专家倒排索引建立方法
4.1 数据获取与预处理
4.1.1 爬取数据
4.1.2 数据预处理
4.2 索引建立方法的研究
4.2.1 建立语言查询模型索引
4.2.2 建立作者主题查询模型索引
4.2.3 索引存储
4.3 本章小结
第五章 专家搜索引擎的设计实现
5.1 搜索引擎的总体设计
5.1.1 开发平台
5.1.2 搜索引擎框架设计
5.1.3 搜索引擎流程设计
5.1.4 引擎数据库设计
5.2 搜索引擎各模块的设计与实现
5.2.1 数据获取模块
5.2.2 建立索引模块
5.2.3 专家检索模块
5.2.4 专家排序模块
5.3 搜索引擎展示
5.4 本章小结
第六章 验证实验及分析
6.1 作者主题聚类验证
6.2 搜索引擎查询验证
6.2.1 查询速度
6.2.2 查询准确性
6.3 本章小结
第七章 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
本文编号:3800478
【文章页数】:64 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
缩略词表
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 专家检索研究现状
1.2.2 研究现状小结
1.3 论文研究内容
1.4 论文组织结构
第二章 相关技术
2.1 搜索引擎相关概念
2.1.1 垂直搜索引擎的定义
2.1.2 垂直搜索引擎的特点
2.1.3 垂直搜索引擎的结构组成
2.2 搜索引擎技术
2.2.1 网络爬虫
2.2.2 倒排索引
2.2.3 链接分析
2.3 本章小结
第三章 专家检索方法
3.1 语言查询模型
3.2 主题查询模型
3.2.1 主题模型
3.2.2 作者主题模型
3.2.3 基于作者主题模型的查询方法
3.3 ExpertRank方法
3.3.1 PageRank
3.3.2 ExpertRank
3.3.3 算法设计与实现
3.4 综合查询方法
3.5 本章小结
第四章 专家倒排索引建立方法
4.1 数据获取与预处理
4.1.1 爬取数据
4.1.2 数据预处理
4.2 索引建立方法的研究
4.2.1 建立语言查询模型索引
4.2.2 建立作者主题查询模型索引
4.2.3 索引存储
4.3 本章小结
第五章 专家搜索引擎的设计实现
5.1 搜索引擎的总体设计
5.1.1 开发平台
5.1.2 搜索引擎框架设计
5.1.3 搜索引擎流程设计
5.1.4 引擎数据库设计
5.2 搜索引擎各模块的设计与实现
5.2.1 数据获取模块
5.2.2 建立索引模块
5.2.3 专家检索模块
5.2.4 专家排序模块
5.3 搜索引擎展示
5.4 本章小结
第六章 验证实验及分析
6.1 作者主题聚类验证
6.2 搜索引擎查询验证
6.2.1 查询速度
6.2.2 查询准确性
6.3 本章小结
第七章 总结与展望
7.1 总结
7.2 展望
致谢
参考文献
本文编号:3800478
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3800478.html
最近更新
教材专著