当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于谷歌搜索引擎产品的研究

发布时间:2017-11-16 15:16

  本文关键词:基于谷歌搜索引擎产品的研究


  更多相关文章: 搜索引擎 PageRank TF-IDF


【摘要】:所有的搜索引擎产品,都可以归结为下载、索引和排序三个步骤,即自动下载海量的网页;建立快速有效的索引;对网页进行公平准确的排序。互联网错综复杂,本质是一张图,每个页面都是一个节点,超链接是连接网页的弧,而自动抓取网络信息的程序就是爬虫。索引是基于数据库的,搜索引擎会自动将用户的查询语句转换成布尔代数进行处理。一个搜索引擎对网页的排序很大程度上决定了搜索引擎的质量。
【作者单位】: 山西大学;
【分类号】:TP391.3
【正文快照】: 1下载——构建网络爬虫1.1图遍历算法的取舍从理论上讲,广度优先搜索(BFS)和深度优先搜索(DFS)算法的时间复杂度都是O(n+e),不同的算法爬下整个静态网页的内容所用的时间是相同的。但在现实生活中,时间有限,互联网时刻变化。所以应该考虑有限时间里尽可能多的爬下最重要的网页

【相似文献】

中国期刊全文数据库 前10条

1 李凯,赫枫龄,左万利;PageRank-Pro——一种改进的网页排序算法[J];吉林大学学报(理学版);2003年02期

2 吴淑燕,许涛;PageRank算法的原理简介[J];图书情报工作;2003年02期

3 杨海东,张莉;PageRank技术分析与搜索引擎检索效率研究[J];淮阴师范学院学报(自然科学版);2003年03期

4 张巍,李志蜀;基于PageRank算法的搜索引擎优化策略[J];计算机应用;2005年07期

5 戚华春,黄德才,郑月锋;具有时间反馈的PageRank改进算法[J];浙江工业大学学报;2005年03期

6 张延红;搜索引擎PageRank算法的改进[J];浙江万里学院学报;2005年04期

7 黄德才;戚华春;;PageRank算法研究[J];计算机工程;2006年04期

8 杨彬;康慕宁;;基于概念的权重PageRank改进算法[J];情报杂志;2006年11期

9 张丽;;PageRank算法的改进[J];科学技术与工程;2007年05期

10 孔娟;马亨冰;;PageRank算法的原理与解析[J];福建电脑;2007年01期

中国重要会议论文全文数据库 前10条

1 ;Key Nodes Mining in Transport Networks Based on PageRank Algorithm[A];2009中国控制与决策会议论文集(3)[C];2009年

2 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年

3 刘松彬;都云程;施水才;;基于分解转移矩阵的PageRank迭代计算方法[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

4 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

5 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

6 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年

7 李洋涛;李川;许超;雷晓;徐洪宇;唐常杰;杨宁;;空间评分:基于PageRank的信息网络可视化中节点重要性度量[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

8 Jonathan J.H.Zhu;;PPS Sampling of Web Graph Using Preferential Jumping Strategy[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年

9 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

10 ;Thinking with simple computer models:Modeling of social-economic systems[A];全国复杂系统研究论坛论文集(一)[C];2005年

中国硕士学位论文全文数据库 前10条

1 蔡建超;基于PageRank算法的搜索引擎优化研究[D];江南大学;2008年

2 邵晶晶;基于PageRank排序算法改进的若干研究[D];华中师范大学;2009年

3 刘文;主题相关的PageRank算法的改进策略的研究和实现[D];中国海洋大学;2009年

4 王磊;PageRank的算法改进[D];上海交通大学;2009年

5 赵波;PageRank算法在非网页检索问题中的应用[D];复旦大学;2010年

6 张巍;基于PageRank算法的搜索引擎优化策略研究[D];四川大学;2005年

7 冯振明;分块式PageRank收敛算法及其改进[D];河海大学;2006年

8 刘先明;基于链接分析的PageRank排序算法的改进研究[D];湖北工业大学;2010年

9 郭庆宝;基于PageRank的搜索引擎优化方法研究[D];山东师范大学;2012年

10 姜sバ,

本文编号:1192771


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1192771.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e5c5e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com