当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于用户行为分析的本地搜索排序算法优化

发布时间:2019-08-12 09:54
【摘要】:虽然搜索引擎出现至今只有二十多年的历史,但是,已经从起初的服务器检索发展到网上海量数据的搜索。现在,由于人们对检索结果质量的要求逐渐提高和网络信息量的迅速增加,使得搜索引擎开始向着专业化、人性化方面发展。 本地搜索引擎作为通用搜索引擎的个性化实现,在检索内容和数据结构等方面都有着明显的区别,传统的排序算法并不能完全适用于本地搜索。本地搜索内容和人们的日常生活息息相关,,检索的过程很大程度上依赖于用户的行为习惯。结合本地搜索的特点,通过对通用搜索和本地搜索中的用户检索行为进行对比分析,本文提出了基于用户行为特征的本地搜索引擎系统框架。 首先,使用Nutch搜索引擎作为基础部分的核心,增加本地生活词典运用双向匹配法进行中文分词,提出适用于本地搜索的POI三部分索引,实现了本地搜索引擎的爬虫、索引和检索三大基础模块。 然后,分析目前通用搜索利用用户行为特征进行优化搜索的研究发展现状和现有用户行为特征采集的方法,对比本地搜索和通用搜索的特点,选取适用于本地搜索的用户行为特征,并提出了本地搜索的用户行为特征采集方案。 最后,为了使用提取的本地搜索用户行为特征运用到排序优化中,将机器学习的SVM分类算法变为适用于排序的SVM排序算法,再运用SVM排序算法将采集到的本地搜索用户行为特征值和通用搜索的排序结果相融合,得出基于用户行为分析的本地搜索排序结果。 为了验证用户行为对排序结果的优化作用,使用三种方法进行对比实验。实验结果显示,融入了用户行为特征后,本地搜索的排序结果平均准确率和前十名文档的相关性都有了一定的提高。用户行为特征使得排序结果可以更容易、准确地反应用户的兴趣,提升了用户的搜索体验。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP391.3

【参考文献】

相关期刊论文 前10条

1 杜传明;;百度地图API在小型地理信息系统中的应用[J];测绘与空间地理信息;2011年02期

2 王仕仲;宁龙兵;;基于Nutch的中文搜索引擎的研究与实现[J];电脑开发与应用;2009年07期

3 曲卫华;王群;;搜索引擎原理介绍与分析[J];电脑知识与技术;2006年35期

4 李秦渝;王秀丽;;SVMlight算法和SMO算法在入侵检测中的比较研究[J];甘肃高师学报;2011年05期

5 王晓丹,王积勤;支持向量机训练和实现算法综述[J];计算机工程与应用;2004年13期

6 邢东山,沈钧毅;Web使用挖掘的数据采集[J];计算机工程;2002年01期

7 胡涛;路红英;;基于Nutch的搜索引擎的研究[J];计算机时代;2007年01期

8 陆文聪,陈念贻,叶晨洲,李国正;支持向量机算法和软件ChemSVM介绍[J];计算机与应用化学;2002年06期

9 邹海山,吴勇,吴月珠,陈阵;中文搜索引擎中的中文信息处理技术[J];计算机应用研究;2000年12期

10 向坚持;刘相滨;徐选华;;基于用户行为的Web使用挖掘数据采集技术研究[J];计算机与现代化;2007年12期



本文编号:2525637

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2525637.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户add65***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com