当前位置:主页 > 科技论文 > 搜索引擎论文 >

百度的大数据实践

发布时间:2017-09-28 17:31

  本文关键词:百度的大数据实践


  更多相关文章: 搜索引擎 海量数据 互联网 百度 用户 数据应用 关键词 网页数据库 信息 数据产品


【摘要】:正互联网搜索引擎从第一天开始就是大数据应用,互联网产生了海量数据,如何从中找到需要的信息就是一个大数据的命题。搜索引擎正好解决这一问题,网络爬虫首先从数以千亿级的网页中搜集信息,建立网页数据库。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户查询语句相符的网站,便采用排序算法——通常根据网页中关键词的匹配程
【作者单位】: 百度公司;
【关键词】搜索引擎 海量数据 互联网 百度 用户 数据应用 关键词 网页数据库 信息 数据产品
【分类号】:F49
【正文快照】: 互联网搜索引擎从第一天开始就是大数据应用,互联网产生了海量数据,如何从中找到需要的信息就是一个大数据的命题。搜索引擎正好解决这一问题,网络爬虫首先从数以千亿级的网页中搜集信息,建立网页数据库。当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与

【相似文献】

中国期刊全文数据库 前10条

1 董晓常;;百度关口[J];互联网周刊;2006年36期

2 袁学伦;;百度:创新团队推动战略变身[J];经理人;2008年10期

3 ;百度推出老年搜索频道[J];天津社会保险;2009年03期

4 张健敏;;微软"必应" 有求"必应"乎?[J];上海信息化;2009年07期

5 ;百度不完全批判[J];互联网天地;2010年02期

6 ;到互联网去,启动汽车营销“搜索”引擎[J];广告大观(综合版);2009年06期

7 王新业;;淘宝 VS 百度死磕 C2C[J];企业文化;2009年07期

8 李娜;;淘宝VS百度:缘何死磕C2C[J];品牌;2009年05期

9 林涛;;谷歌逼近百度[J];中国企业家;2009年08期

10 贾玉文;;国内搜索引擎SWOT战略分析——以百度公司为例[J];生产力研究;2009年22期

中国重要会议论文全文数据库 前10条

1 包木春;;浅谈互联网情报信息收集[A];第二十次全国计算机安全学术交流会论文集[C];2005年

2 张冠群;杜建清;杨家海;;基于搜索引擎的网站流量估算模型[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年

3 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年

4 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年

5 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年

6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

7 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年

8 陈沛;;搜索的未来[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

9 张t$t$;陈华;姜晓宁;;农业电子图书馆在网络搜索引擎冲击下如何发展的几点思考[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年

10 褚蓓蓓;刘丹;;垂直搜索引擎:搜索引擎发展方向[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年

中国重要报纸全文数据库 前10条

1 加贝;百度谷歌风景独好 搜索引擎“冬泳”正酣[N];证券日报;2008年

2 本报记者 何苗;李彦宏 专注于简单管理[N];中华工商时报;2009年

3 本报记者 郭川;移动搜索要跳出传统互联网模式[N];人民邮电;2009年

4 见习记者 张惠;谷歌退出?中国搜索市场前路难测[N];中国商报;2010年

5 本报记者 姜靖;雷鸣:四年跻身数字音乐三甲[N];科技日报;2009年

6 本报记者 李新国;传统搜索变身挑战互联网[N];南京日报;2006年

7 本报记者 张明;谷歌攻城计[N];中国经营报;2009年

8 加贝;李开复入主三年有余 谷歌中国变化几多?[N];证券日报;2009年

9 何军;“凤巢”现身 助中国企业过冬[N];证券日报;2009年

10 ;“搜索引擎”为学术造假提供了便利[N];辽宁日报;2010年

中国博士学位论文全文数据库 前10条

1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年

2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年

3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年

4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年

5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年

6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年

7 王昤璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年

8 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年

9 郑文良;基于简单本体的农业P2P搜索引擎关键技术研究[D];沈阳农业大学;2013年

10 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年

中国硕士学位论文全文数据库 前10条

1 郝金隆;网络原创文章优先的搜索引擎排序算法研究[D];重庆大学;2007年

2 徐坤;基于关系数据库搜索引擎的研究[D];长春理工大学;2008年

3 何华;搜索引擎中的数据存储问题研究[D];浙江大学;2005年

4 李珏伶;搜索引擎网页相关性评估方法设计及其在rank模型上的应用[D];北京交通大学;2011年

5 刘宇波;面向可下载资源的WEB搜索引擎的设计与实现[D];湖南大学;2005年

6 余光莉;基于互联网的交互式积累式WebTRIZ系统[D];天津大学;2005年

7 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年

8 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年

9 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年

10 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年



本文编号:937150

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/937150.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f8498***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com