中文搜索引擎中的PageRank算法及实现
本文关键词: 搜索引擎 网页排序 网络链接图 稀疏矩阵 汇点 出处:《计算机工程与设计》2007年07期 论文类型:期刊论文
【摘要】:由于网页质量千差万别,对网页进行基于网络链接图的质量排序变成了现代搜索引擎的一个重要部件。分析了对网络排序模块的实现进行优化时,造成大规模稀疏矩阵-向量乘法运算低效的原因,并结合网络链接图的实际情况提出了几种不同的优化策略。然后,对几种优化策略做了实验性能比较,并综合考虑各种优化策略的运算效率和存储量需求,选择了适合实际系统的优化策略。同时,提出PageRank算法在实现时的一个变通处理——除汇。
[Abstract]:Because the quality of web pages varies widely, the quality sort based on the web link graph becomes an important part of the modern search engine. The optimization of the implementation of the network sorting module is analyzed. The reason for the inefficient operation of large scale sparse matrix-vector multiplication and the actual situation of the network link graph proposed several different optimization strategies. Then the experimental performance of several optimization strategies are compared. Considering the operational efficiency and storage requirements of various optimization strategies, the optimization strategy suitable for the practical system is selected. At the same time, a flexible processing of the PageRank algorithm is proposed, that is, deremittance.
【作者单位】: 浙江大学
【分类号】:TP391.3
【正文快照】: 0引言Internet正以200%的用户增长率迅速发展,成为人们工作和生活不可缺少的信息来源。与此同时,Web文件具有分布、动态变化、结构复杂等特点,使得用户根本无法了解庞大的、瞬息万变的信息资源。由此,人们在信息海洋中搜索自己所需要的信息的能力显得愈发重要。如今,网络信息
【共引文献】
相关期刊论文 前10条
1 朱征宇,朱庆生,张宏森;基于内容模块化的网页快速浏览技术[J];计算机工程与应用;2002年10期
2 陈燕娜,邵志清;基于全文搜索的中文搜索引擎设计技术[J];计算机工程与应用;2002年17期
3 陈波,朱庆生;基于ASP.NET的面向对象网页设计[J];计算机工程与应用;2003年07期
4 张宏森,朱征宇;基于模块的网页设计技术[J];计算机应用研究;2002年02期
5 苗长芬,冯伟华;面向主题Crawler的设计与实现[J];平原大学学报;2005年03期
6 聂哲;基于WEB的面向主题搜索引擎的设计与实现[J];计算机工程与设计;2003年02期
7 杨震,邓贵仕;基于隐含语义的个性化信息检索[J];计算机工程与设计;2003年07期
8 何昭青;面向用户的个性化Agent智能搜索系统的设计[J];邵阳学院学报;2003年02期
9 田凯;搜索引擎AltaVista调查与测评[J];图书情报工作;2001年12期
10 霍艳蓉;Web信息检索的关键技术[J];现代图书情报技术;2002年06期
相关会议论文 前1条
1 董红斌;苏中滨;;基于Mobile Agent的信息搜索技术[A];全国计算机网络应用年会论文集(2001)[C];2001年
相关博士学位论文 前2条
1 吴建平;稀疏线性代数方程组迭代法中的预处理技术研究[D];中国人民解放军国防科学技术大学;2002年
2 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
相关硕士学位论文 前10条
1 孔磊;基于智能体的个性化互联网信息搜集系统[D];华中科技大学;2004年
2 卢健;潜在语义分析在文本信息检索中的应用研究[D];华中科技大学;2005年
3 李永喜;基于本体的智能信息检索研究[D];中国科学技术大学;2006年
4 林乐彬;Inar网络爬虫的设计与实现[D];哈尔滨工业大学;2006年
5 张志浩;基于本体论的语义检索研究[D];西安电子科技大学;2007年
6 敬宗儒;基于SEMANTIC WEB的语义检索模型的研究[D];华东师范大学;2007年
7 徐东;基于本体的领域智能搜索技术研究[D];哈尔滨工程大学;2007年
8 余淼;主题搜索引擎的信息抽取和索引的研究[D];重庆大学;2007年
9 韩亮;基于本体的消防信息检索系统的研究[D];大连海事大学;2008年
10 王乐;基于本体的垂直搜索引擎研究[D];西北大学;2008年
【相似文献】
相关期刊论文 前10条
1 ;创新工业搜索引擎[J];中国制造业信息化;2011年12期
2 胡风华;王磊;;基于知识库系统的智能搜索引擎研究[J];中国新技术新产品;2011年18期
3 方亚会;;Google失败后快速切换搜索引擎[J];电脑迷;2011年11期
4 李国锋;李春伟;;网络搜索引擎技术探析[J];廊坊师范学院学报;2005年04期
5 冷国华;;网页快照帮我快速获取资料[J];电脑爱好者;2011年10期
6 闫淑红;;基于搜索引擎的信息查询技术研究[J];电脑开发与应用;2011年07期
7 康亚娟;;浅谈站内信息搜索系统[J];硅谷;2011年13期
8 孙掌印;;搜索引擎Yahoo与Google的比较分析[J];科技情报开发与经济;2011年17期
9 冯庆峰;;信息时代如何获取信息[J];成功(教育);2011年08期
10 王巧玲;彭静;王春红;;中文分词技术的研究及在Nutch中的实现[J];科技信息;2011年19期
相关会议论文 前10条
1 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
2 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
3 倪俊峰;;基于黄页搜索引擎的关键字排名广告系统的设计与实现[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年
4 张怡;查贵庭;;SEO在信息服务中的应用研究[A];2010年中国索引学会年会暨学术研讨会论文集[C];2010年
5 陈援非;何哲;朱珍民;;基于普适计算的个性化搜索技术[A];第二届和谐人机环境联合学术会议(HHME2006)——第2届中国普适计算学术会议(PCC'06)论文集[C];2006年
6 杨萌;李春丽;朱明;;网络搜索技术下的编辑工作[A];学报编辑论丛(第十一集)[C];2003年
7 陈磊;茹立云;马少平;;基于用户日志挖掘的搜索引擎广告效果分析[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
8 申琪君;;电子地图搜索引擎比较[A];中国地理学会2007年学术年会论文摘要集[C];2007年
9 岑荣伟;刘奕群;张敏;茹立云;马少平;;网络搜索引擎用户行为分析和研究[A];第五届全国信息检索学术会议论文集[C];2009年
10 萨晓静;;网络化生存下的图书馆改革之路[A];福建省图书馆学会2008年学术年会论文集[C];2008年
相关重要报纸文章 前10条
1 本报记者 朱杰;搜索引擎应用性能分析报告[N];中国计算机报;2009年
2 记者 李建伟;第4代搜索引擎在郑州问世[N];中国知识产权报;2009年
3 记者 赵志鹏;媒体称俄拟建国家搜索引擎[N];新华每日电讯;2010年
4 吴前;搜索引擎“碳排量”惊人[N];中国文化报;2010年
5 记者 李大庆;新型搜索引擎能向用户直接提供所需内容[N];科技日报;2010年
6 深圳大学传播学院、传媒与文化发展研究中心 周裕琼;谁动了我的大脑[N];社会科学报;2010年
7 李大庆;新型搜索引擎直接为用户提供所需内容[N];中国技术市场报;2010年
8 余建斌;搜索引擎市场“烽烟四起”[N];中国高新技术产业导报;2010年
9 迈巴赫 编译;搜索引擎20年[N];计算机世界;2010年
10 记者 秦羽 通讯员 施银峰;全球搜索引擎营销大会在甬举行[N];宁波日报;2010年
相关博士学位论文 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
8 曹欢欢;基于大规模搜索日志挖掘的上下文感知搜索研究[D];中国科学技术大学;2009年
9 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
10 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
相关硕士学位论文 前10条
1 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
2 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
3 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
4 闫继钢;搜索引擎的研究与实现[D];兰州大学;2009年
5 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
6 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
7 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
8 尹辉;基于Nutch的搜索系统的研究[D];电子科技大学;2008年
9 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年
10 张朝斌;企业级搜索引擎的优化设计与实现[D];华南理工大学;2010年
,本文编号:1453905
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1453905.html