网页排序中的随机模型及算法
本文选题:信息检索 + 排序联合问题 ; 参考:《中国科学:数学》2011年12期
【摘要】:随着互联网规模的日益增长,搜索引擎已经成为互联网上有效的信息获取工具.而在众多搜索引擎的背后,是信息检索技术,也即网页排序算法在起作用.网页排序包括重要性排序和相关性排序.通过我们研究发现,尽管这两类排序所依据的准则不同,但是都可以通过建立适当的随机过程模型来研究.对于网页重要性排序,我们通过分析用户浏览网页的行为建立了Markov骨架过程的框架.基于该框架我们分析了三种不同的随机过程模型对用户行为模拟的合理程度,并设计了名为BrowseRank的一组新算法,该算法可以根据用户上网行为来计算网页的重要性.在网页相关性排序中,我们主要针对排序结果联合问题建立了一个基于Markov链的监督学习框架.通过将传统方法的监督化,使原来难于解决的问题变的易于学习,将原来的NP-难问题转化为一个半正定规划问题,提高了效率.
[Abstract]:With the increasing scale of the Internet, search engine has become an effective information acquisition tool on the Internet. In many search engines, the information retrieval technology, that is, the sorting algorithm of web pages is at work. Page sorting includes importance sort and relevance sort. It is found from our study that although the criteria for these two types of ordering are different, they can be studied by establishing appropriate stochastic process models. For the importance ranking of web pages, we set up the framework of Markov skeleton process by analyzing the behavior of users browsing web pages. Based on this framework, we analyze the rationality of three different stochastic process models for user behavior simulation, and design a new algorithm called BrowseRank, which can calculate the importance of web pages according to users' online behavior. In order to solve the problem of ranking results, we establish a supervised learning framework based on Markov chain. Through the supervision of the traditional method, the problem that is difficult to solve is easy to learn, and the original NP-hard problem is transformed into a semi-positive definite programming problem, and the efficiency is improved.
【作者单位】: 北京交通大学理学院数学系;中国科学院数学与系统科学研究院;
【基金】:国家自然科学基金(批准号:11001010)资助项目
【分类号】:O211.6;TP393.092
【共引文献】
相关期刊论文 前10条
1 吴新生;大偶数表为两个素数之和(下)[J];安徽广播电视大学学报;2001年01期
2 叶承汾;论3x+1问题[J];北京工业职业技术学院学报;2004年01期
3 丘维声;一重差置换[J];北京大学学报(自然科学版);1986年05期
4 乐茂华;LCM函数的倒数和[J];宝鸡文理学院学报(自然科学版);2003年04期
5 廖群英,孙琦;关于有限域上原根的分布[J];北京邮电大学学报;2004年04期
6 余启港;原根理论的推广及其应用(Ⅰ)[J];江西师范大学学报(自然科学版);1996年01期
7 余启港,荣子英;原根理论的推广及其应用(Ⅱ)[J];江西师范大学学报(自然科学版);1996年02期
8 徐肇玉;;平方根的最佳逼近[J];纯粹数学与应用数学;1991年01期
9 乐茂华;关于方程S_x(n)=S_y(3)[J];常德师范学院学报(自然科学版);2002年04期
10 邹兆南;关于不定方程x~n+(x+1)~n+…+(x+h)~n=(x+h+1)~n的几个定理[J];重庆交通学院学报;1990年02期
相关博士学位论文 前10条
1 亢保元;分组密码中置换理论的研究[D];西安电子科技大学;1998年
2 张彤;信息隐藏与阈下信道技术研究[D];西安电子科技大学;2001年
3 周永彬;PKI理论与应用技术研究[D];中国科学院研究生院(软件研究所);2004年
4 郭曙光;有理方体与堆垒数论中若干问题[D];南京师范大学;2004年
5 王文松;有限域上几类超曲面的研究[D];四川大学;2005年
6 朱华伟;高师奥林匹克数学课程研究[D];华中科技大学;2005年
7 车建明;C/Cu复合材料的磨损特性及耐磨损设计准则的研究[D];天津大学;1996年
8 冯国柱;PKI关键技术研究及其应用[D];国防科学技术大学;2006年
9 胡永忠;Lucas与Lehmer数的本原素除子存在性理论在指数丢番图方程中的应用[D];中南大学;2006年
10 李继业;养殖刺参免疫学特征与病害研究[D];中国海洋大学;2007年
相关硕士学位论文 前10条
1 周洲仪;基于开票代理的电子投票系统的设计与分析[D];湖南大学;2001年
2 王勇慧;关于Dedekind和的推广型均值公式及Hardy和的推广型均值公式[D];西北大学;2001年
3 邓玉平;关于D.H.Lehmer问题的推广及关于类Dedekind和的均值公式[D];西北大学;2001年
4 林晓霞;双弧竞赛图的若干问题[D];厦门大学;2001年
5 李伟平;算术级数中三个或多个素数的和[D];河南大学;2002年
6 王顺满;数据传输安全协议分析改进及测试[D];燕山大学;2002年
7 黄忠铣;数论函数的某些性质[D];南京师范大学;2002年
8 孙学功;关于Romanov定理中的常数[D];南京师范大学;2003年
9 王胜红;远程故障监测、诊断、维护系统中的网络数据传输安全研究[D];南京理工大学;2003年
10 霍家佳;关于Schoof算法的一个注记[D];四川大学;2003年
【相似文献】
相关期刊论文 前10条
1 洪声贵;王永成;;信息检索的一个数学模型(Ⅰ)[J];辽宁大学学报(自然科学版);1985年03期
2 孙成喜;;基于贝叶斯网络的电子商务货源信息检索模型[J];电子商务;2011年06期
3 洪声贵;王永成;;信息检索的一个数学模型(Ⅱ)[J];辽宁大学学报(自然科学版);1985年04期
4 朱义军,马范援,白英彩;基于客户搜索的自适应代理机制设计[J];通信学报;1997年12期
5 赵芳;李林红;胡玉瑞;;链接分析算法在公共决策中的应用探讨[J];情报学报;2010年06期
6 袁通路,刘勇,陈建铎,赵小平;学术论文信息检索统计系统设计与实现[J];科技.人才.市场;2003年05期
7 唐杰;宫继兵;刘柳;杨文军;;基于话题模型的学术社会网络建模及应用[J];中国科技论文在线;2011年01期
8 冯玉明;如何检索数学文献—数学文献信息检索的回顾与展望[J];数学的实践与认识;1995年01期
9 黄钢石,张亚非,陆建江,徐宝文;一种受限非负矩阵分解方法[J];东南大学学报(自然科学版);2004年02期
10 王囡;薛昀;乔李明;刘琦;;基于正交设计的大学图书馆使用效率调查研究[J];高校图书馆工作;2009年06期
相关硕士学位论文 前2条
1 孙群虎;基于空间分布和信息熵的特征词提取方法[D];大连理工大学;2010年
2 娄娟;模糊理论在文本分类中的应用研究[D];重庆大学;2011年
,本文编号:2006342
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2006342.html