当前位置:主页 > 科技论文 > 自动化论文 >

RankNet学习排序算法的一种改进

发布时间:2018-11-28 12:07
【摘要】:随着信息科技的迅猛发展,使用Search Engin获得网络资源是大众的生活方式。同时,海量的网页信息对搜索引擎的带来极大的挑战,比如如何快速准确的从信息的汪洋大海中找到用户想要的信息,如何将最有用的信息最先展现在用户搜索结果中。而衡量搜索引擎性能好坏的关键因素就是搜索排序算法。早期的网页排序算法考虑的排序因子比较简单,同时检索出结果的准确性难以保证。随着人工智能的不断发展,近年来机器学习和排序学习的研究也受到了国内外广大学者的广泛关注,排序学习算法在IR、协同过滤、NLP、情感分析、在线广告、系统推荐等领域发挥着重要作用,并且越来越多的人工智能学者把它作为热点研究方向。本论文旨在研究基于RankNet神经网络学习排序算法,该算法主要由Chris Burges等人第一次提出,并且在相关的搜索引擎中广泛采用,通过对RankNet神经网络算法的研究来提高网页搜索结果的用户体验。总结起来,论文的重点内容包括以下3点:(1)论文整体研究了排序算法的演变过程和现在研究状况,概要性地对Learn to Rank算法做了描述,其中对网页搜索排序算法的评价标准和优化方向做了相关研究,用于评价RankNet算法改进后的性能,做了两点改进和优化。(2)第一点改进:论文使用交叉熵和均方差的线性组合的损失函数改进了RankNet算法,对改进后的损失函数选取正确性加以证明,以解决原始算法中一个样本对儿中两个文档与查询的相关性大小被忽略的问题;第二点改进:通过增加查询的权重,解决了不同查询对应文档数量差异很大时,对学习过程产生的误导,使得算法训练出来的模型更加准确,实现了查询平等性。(3)最后运用BP神经网络模型对RankNet和改进后的算法在微软的数据集中进行验证比较,用不同的排序算法指标对改进前后的算法进行分析,表明改造损失函数后对排序的准确度有提升,验证了改进后的效果。
[Abstract]:With the rapid development of information technology, the use of Search Engin to obtain network resources is a popular way of life. At the same time, massive web information brings great challenges to search engines, such as how to quickly and accurately find the information users want from the ocean of information, how to first display the most useful information in the user search results. The key factor to measure the performance of search engines is the search sorting algorithm. The early web page sorting algorithm considered the sorting factor is relatively simple, and the accuracy of retrieval results is difficult to ensure. With the development of artificial intelligence, the research of machine learning and ranking learning has been paid more and more attention by many scholars at home and abroad in recent years. The sorting learning algorithm is applied in IR, collaborative filtering, NLP, emotional analysis, online advertising, and so on. System recommendation and other fields play an important role, and more artificial intelligence scholars regard it as a hot research direction. The purpose of this paper is to study the learning sorting algorithm based on RankNet neural network, which was proposed by Chris Burges et al for the first time and is widely used in related search engines. The RankNet neural network algorithm is studied to improve the user experience of web search results. To sum up, the main contents of this paper include the following three points: (1) the evolution process and current research status of the sorting algorithm are studied in this paper, and the Learn to Rank algorithm is described briefly. The evaluation standard and optimization direction of web search sorting algorithm are studied, which is used to evaluate the improved performance of RankNet algorithm. Two improvements and optimizations are made. (2) the first one is improved: the RankNet algorithm is improved by the linear combination of cross entropy and mean square error, and the correctness of the improved loss function is proved. In order to solve the problem that the correlation between two documents and query is ignored in a sample pair in the original algorithm; The second improvement: by increasing the weight of the query, it solves the misdirection of the learning process when the number of corresponding documents of different queries is very different, which makes the model trained by the algorithm more accurate. Finally, the BP neural network model is used to verify and compare the RankNet and the improved algorithm in Microsoft data set, and the improved algorithm is analyzed with different sorting algorithm indexes. It is shown that the accuracy of sequencing is improved after the loss function is modified, and the improved effect is verified.
【学位授予单位】:吉林大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP18;TP391.3

【相似文献】

相关期刊论文 前10条

1 安朝辉;钱剑敏;;一种新的排序算法——端点排序算法[J];现代电子技术;2011年24期

2 卢敏;黄亚楼;谢茂强;王扬;刘杰;廖振;;代价敏感的列表排序算法[J];计算机研究与发展;2012年08期

3 张正铀;;散列排序算法[J];广西科学院学报;1982年01期

4 全惠云;;基于矩阵分裂法的一类异步N&行排序算法[J];计算技术与自动化;1991年01期

5 董德林;两个高效排序算法的APPLESOFT BASIC程序[J];丽水师专学报;1992年S1期

6 王晓东;最优堆排序算法[J];小型微型计算机系统;2000年05期

7 吴江,张德同;二次分“档”链接排序算法分析[J];计算机研究与发展;2001年08期

8 李德启,王雄;一种新型快速的排序算法[J];计算机工程;2001年03期

9 赵忠孝;一种新的散列排序算法[J];电脑开发与应用;2001年03期

10 许善祥,朱学东,邵敬春;选择排序算法的改进[J];佳木斯大学学报(自然科学版);2001年04期

相关会议论文 前10条

1 周晓方;金志权;;寻找最佳分布式排序算法[A];第九届全国数据库学术会议论文集(上)[C];1990年

2 张艳秋;李建中;;一种基于蛇型磁带的排序算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

3 刘春阳;叶君峰;母海龙;陆秋霞;陈沧;高莺;;一种商品标题主题词的重要性排序算法[A];第五届全国信息检索学术会议论文集[C];2009年

4 王少帅;汤庆新;姚路;;并行独立集排序算法的改进与实现[A];第十六届全国青年通信学术会议论文集(上)[C];2011年

5 于芳;王大玲;于戈;陈冬玲;鲍玉斌;;面向用户的排序算法研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

6 闫泼;马军;陈竹敏;;面向主题的网页排序算法研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 张健沛;李连江;杨静;;个性化搜索引擎排序算法的研究与改进[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

8 吴志彬;陈义华;;ANP中超矩阵排序算法研究[A];2006中国控制与决策学术年会论文集[C];2006年

9 陈丛丛;石冰;陈健;;面向主题的查询相关网页排序算法[A];第三届中国智能计算大会论文集[C];2009年

10 齐曼;张珩;;实时视觉仿真中帧连贯性应用[A];'2000系统仿真技术及其应用学术交流会论文集[C];2000年

相关重要报纸文章 前1条

1 广东 黄陀;基本算法简介(三)[N];电脑报;2001年

相关博士学位论文 前3条

1 赵立军;基于归并的高效排序算法的研究[D];中国科学院研究生院(计算技术研究所);1998年

2 崔筠;无向基因组的移位排序算法[D];山东大学;2006年

3 郝凡昌;有向基因组复合操作重组排序算法研究[D];山东大学;2011年

相关硕士学位论文 前10条

1 徐林龙;基于商品特征属性的排序算法研究[D];西南交通大学;2015年

2 陈浩;基于图理论的图像搜索结果重排序的研究[D];安徽大学;2016年

3 双全;基于用户行为分析的搜索排序算法研究[D];华中科技大学;2014年

4 王麒深;面向网络舆情的社会情感排序算法研究[D];中国民航大学;2012年

5 郭佳;一种SDN环境中的网络节点重要性排序算法[D];西安电子科技大学;2015年

6 冯少泳;两层哈希的重排序算法[D];华南理工大学;2016年

7 陆沛栋;基于可重构SoC平台的排序算法设计和自相关算法优化[D];南京大学;2017年

8 祁洋;RankNet学习排序算法的一种改进[D];吉林大学;2017年

9 王靖;数据库管理系统中高能效排序算法[D];浙江工业大学;2012年

10 尹晓;基因组移位排序算法的改进和评测[D];山东大学;2006年



本文编号:2362782

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2362782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f4a46***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com