基于改进PageRank算法的个性化搜索的研究
发布时间:2021-04-12 08:22
随着互联网技术的发展和网络信息的与日俱增,网络信息面临信息量大、信息形式混乱、难以管理的状况。目前互联网搜索引擎技术是针对关键词匹配进行搜索,对于搜索返回结果并不进行过滤处理,给搜索用户查找所需信息造成了很大的不便,降低了搜索的效率。而且随着互联网用户体验和交互需求的增加,个性化搜索成为搜索引擎研究的主要方向和趋势。对于个性化搜索技术来说,用户兴趣模型是个性化搜索的核心,用户兴趣模型建立的好坏直接影响了个性化搜索的质量。 本文是基于Google著名的PageRank排名算法建立用户兴趣模型从而对个性化搜索进行研究。第一章主要介绍了课题的背景意义、国内外研究现状和本文研究所用到的理论基础;第二章主要针对建立用户兴趣模型所用到的技术进行分析,得到用户兴趣模型的最初框架;第三章主要根据对PageRank算法的改进推导出用户兴趣数学模型;第四章主要是设计实验,通过相关数据分析和计算来验证用户兴趣模型的正确性;第五章是对全文的总结和展望。本文的重点是对PageRank算法原理的分析和改进,分析个性化搜索引擎和用户浏览行为,研究用户兴趣获取方式,建立基于网页收藏夹和浏览记录的用户兴趣模型,难点是进行实验设计验证用户兴趣模型的正确性。
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
本文编号:2187006
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3
文章目录
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和意义
1.1.1 研究背景
1.1.2 研究意义
1.2 相关技术国内外研究现状
1.2.1 个性化搜索技术的国内外研究现状
1.2.2 搜索引擎排名算法的国内外研究现状
1.3 PageRank排名算法介绍
1.3.1 PageRank基本概念
1.3.2 PageRank算法
1.3.3 PageRank算法的优缺点和改进
1.4 论文研究内容和结构安排
1.4.1 研究内容
1.4.2 论文组织结构
第二章 用户行为分析和用户兴趣模型框架的建立
2.1 个性化搜索
2.1.1 个性化搜索引擎技术
2.1.2 用户行为分析
2.1.3 用户兴趣获取方式分类
2.1.4 关键词提取技术
2.2 几种用户兴趣模型分析
2.2.1 基于向量空间模型
2.2.2 基于Tag用户兴趣模型
2.2.3 基于分类的用户兴趣模型
2.3 用户兴趣模型框架的建立
2.4 本章小结
第三章 基于网页收藏夹和浏览记录的用户模型
3.1 基于网页收藏夹的网页权值分析
3.1.1 用户浏览行为概述
3.1.2 TF-IDF关键词权重计算
3.1.3 PR值加权计算
3.2 基于浏览记录的网页权值分析
3.2.1 用户浏览行为概述
3.2.2 时间遗忘曲线和遗忘因子
3.2.3 PR值加权计算
3.3 个性化搜索模型的搭建
3.3.1 模型结构
3.3.2 数据分析处理
3.3.3 模型搭建
3.4 本章小结
第四章 基于改进算法的用户兴趣模型实验验证
4.1 实验设计
4.1.1 实验条件
4.1.2 实验用户行为分析
4.1.3 实验模型设计
4.1.4 实验假设
4.2 基于改进的PageRank算法进行数据分析和计算
4.2.1 实验数据表建立
4.2.2 数据计算
4.3 对比分析实验结果和验证
4.3.1 实验结果分析
4.3.2 实验验证结论
4.4 本章小结
第五章 结论与展望
5.1 全文总结
5.2 研究展望
参考文献
致谢
【引证文献】
相关硕士学位论文 前1条
1 王钦为;面向用户的个性化搜索引擎算法研究与系统设计[D];华南理工大学;2012年
本文编号:2187006
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2187006.html