基于页面分块的网页排序算法:BHITS
本文选题:网页排序 切入点:搜索引擎 出处:《计算机工程》2010年11期 论文类型:期刊论文
【摘要】:介绍大型搜索引擎应用的主流网页排序算法,改进其中的HITSS算法,提出一种基于网页分块技术的BHITS算法。BHITS算法通过对分好的页面板块进行主题标定,根据待采集信息的主题为不同主题的板块设定不同的权值实现相关度判定,在保持算法高效率的前提下,提高了算法区分链接重要性的能力。与相关算法的对比实验结果表明,BHITS算法网页排序的准确率明显优于其他算法。
[Abstract]:This paper introduces the mainstream web page sorting algorithm for large search engine applications, improves the HITSS algorithm, and proposes a BHITS algorithm. BHITS algorithm based on the partitioning technology of web pages is proposed to calibrate the theme of the partitioned pages. According to the topic of the information to be collected, different weights are set for different topics to determine the correlation degree. Under the premise of keeping the algorithm high efficiency, The experimental results show that the accuracy of BHITS is better than that of other algorithms.
【作者单位】: 解放军信息工程大学信息工程学院;
【分类号】:TP391.3
【参考文献】
相关期刊论文 前1条
1 石晶,龚震宇,裘杭萍,张毓森;一种更稳定的链接分析算法——子空间HITS算法[J];吉林大学学报(理学版);2003年01期
【共引文献】
相关期刊论文 前8条
1 李江;殷之明;;链接分析研究综述[J];大学图书馆学报;2008年02期
2 侯青;;超链接的方式给应用程序传递参数方法的实现[J];信息技术;2009年10期
3 李向伟;曹博;;时间参数在HITS算法中的应用及改进[J];兰州工业高等专科学校学报;2006年02期
4 葛蓉;利用网络日志分析提高搜索引擎的检准率[J];情报科学;2004年10期
5 闫建红;;企业智能化Web商务数据挖掘引擎算法设计与实现[J];计算机工程与设计;2007年04期
6 丁宝琼;蒋建中;郭军利;;Web超链接分析算法研究[J];通信技术;2009年01期
7 蒋卫星;金瓯;张彬;;Web搜索算法研究综述[J];计算机技术与发展;2007年04期
8 王学龙;张雪梅;李向伟;;时间参数在HITS算法中的应用及改进[J];现代计算机;2006年06期
相关硕士学位论文 前8条
1 丁宝琼;网络文本信息采集分析关键技术研究与实现[D];解放军信息工程大学;2009年
2 蒋宇;面向Web安全的漏洞检测系统的研究与实现[D];吉林大学;2011年
3 韩巍;Web信息智能检索研究[D];合肥工业大学;2004年
4 王斐;基于增量反馈和自适应机制的主题爬虫系统的设计与实现[D];南京理工大学;2005年
5 徐金雷;专业搜索引擎的排序算法研究[D];南京师范大学;2007年
6 周炳;基于K-L变换的权威页面挖掘的算法[D];华中科技大学;2006年
7 卜永忠;面向金融信息的主题爬虫研究与应用[D];哈尔滨工业大学;2008年
8 王菲;一种改进的HITS算法在SNS类网站用户影响力评估系统中的应用[D];吉林大学;2012年
【二级参考文献】
相关期刊论文 前1条
1 王奇,宋国新,邵志清;信息检索中基于链接的网页排序算法[J];华东理工大学学报;2000年05期
【相似文献】
相关期刊论文 前10条
1 张瑜;袁方;;基于用户兴趣的个性化信息检索方法[J];山东大学学报(理学版);2006年03期
2 张磊;;搜索引擎综述[J];泰州科技;2008年08期
3 刘飞;高红艳;;基于数据挖掘的Web信息检索的研究[J];江西科学;2008年02期
4 彭芳策;;基于Smarty的站内搜索设计与实现[J];兴义民族师范学院学报;2011年02期
5 任丽芸;杨武;唐蓉;;搜索引擎网页排序算法研究综述[J];电脑与电信;2010年05期
6 唐君健;;基于个性化搜索技术的校园网内部搜索引擎的设计[J];中国信息技术教育;2010年01期
7 徐家树,邢立新,覃征;基于链接文本相关度的超链接算法(英文)[J];哈尔滨商业大学学报(自然科学版);2005年03期
8 胡必云;黄因生;谢荣传;;基于语义的Web信息检索[J];计算机技术与发展;2006年10期
9 李丹;鲁明羽;时丽莎;;循证医学信息化若干关键技术的研究[J];广西师范大学学报(自然科学版);2008年03期
10 周鹏;吴华瑞;赵春江;杨宝祝;朱华吉;;基于Nutch农业搜索引擎的研究与设计[J];计算机工程与设计;2009年03期
相关会议论文 前10条
1 李贺华;付鹤岗;;多Agent Web信息检索应用研究[A];2008年计算机应用技术交流会论文集[C];2008年
2 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
3 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
4 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
6 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
7 姚树宇;赵少东;;一种使用分布式技术的搜索引擎[A];2005年全国开放式分布与并行计算学术会议论文集[C];2005年
8 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
9 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
10 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
相关重要报纸文章 前10条
1 郭京霞;百度胜诉搜索引擎排名纠纷案[N];中国企业报;2007年
2 焦艳玲;枫叶之都告百度恶意排名[N];市场报;2007年
3 夏凌;搜索引擎排名纠纷百度胜出[N];中华工商时报;2007年
4 李一鑫;搜索排名的红与黑[N];财经时报;2007年
5 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
6 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
7 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,,还是门户[N];中国计算机报;2005年
8 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
9 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
10 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
5 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
6 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
7 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
8 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年
9 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
10 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
相关硕士学位论文 前10条
1 王军;中文搜索引擎的设计与实现[D];华中科技大学;2004年
2 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
3 徐永红;基于专题信息服务的智能搜索引擎技术研究[D];国防科学技术大学;2004年
4 金祖旭;基于用户反馈的搜索引擎排名算法研究[D];复旦大学;2010年
5 尹辉;基于Nutch的搜索系统的研究[D];电子科技大学;2008年
6 闫继钢;搜索引擎的研究与实现[D];兰州大学;2009年
7 苏国荣;校园网搜索引擎排序的去重方法研究[D];国防科学技术大学;2010年
8 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
9 黄大鹏;基于语义Web的搜索引擎研究[D];西安理工大学;2004年
10 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
本文编号:1640313
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1640313.html