面向移动应用商店的分布式爬虫系统设计与实现
【图文】:
图2-1百度应用商店应用导航页逡逑下面以百度应用商店为例,具体分析其网页结构特征。进入百度应用商店首逡逑页后,就能看到如图2-1所示的应用分类导航信息,此版块将应用商店中的所有逡逑应用按功能作用进行了分类,如社交通讯类、系统工具类等。以这些分类导航链逡逑接为入口,点击进入以后,会看到应用按一定的方式排列呈现在页面中,并以翻逡逑页的形式列出了该类别中的所有应用,如图2-2所示。从应用列表页中能够提取逡逑到应用详细页面的URL,进而访问应用详细页,应用详细页中包含了应用的具逡逑7逡逑
百度应用商店应用列表页百度李抓姗浮猫负,,按释》苦眺工皿,帕汽万瀚钥胜
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:TP391.1;TP393.092
【参考文献】
相关期刊论文 前10条
1 南磊;;基于Hadoop的图书推荐系统研究与设计[J];计算机与数字工程;2016年06期
2 邹科文;李达;邓婷敏;李嘉振;陈义明;;网络爬虫针对“反爬”网站的爬取策略研究[J];电脑知识与技术;2016年07期
3 马志强;张泽广;李昊u&;刘利民;;基于分布式架构的主题信息采集系统[J];计算机工程与设计;2015年04期
4 高荣;;基于Scrapy和casperjs的电子商务网站信息采集系统研究[J];数字技术与应用;2015年03期
5 杨永光;;代码签名在手机应用商店的应用[J];信息安全与通信保密;2014年10期
6 陈荟慧;舒云星;林丽;;Web语料抓取中基于相似度的URL过滤规则生成算法[J];模式识别与人工智能;2014年07期
7 史宝明;贺元香;吴崇正;;主题搜索引擎中爬虫搜索策略的研究[J];计算机工程与应用;2014年02期
8 方明科;王煜霞;;一种动态Web信息提取方法的设计与实现[J];管理工程师;2011年03期
9 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期
10 陈俊彬;;Web信息抽取策略及其实现方法研究[J];科技情报开发与经济;2008年23期
相关博士学位论文 前1条
1 何川;分布式信息检索中的若干重要问题研究[D];北京邮电大学;2012年
相关硕士学位论文 前7条
1 孔维健;基于图聚类的招投标数据挖掘研究与应用[D];中山大学;2015年
2 李婷;分布式爬虫任务调度与AJAX页面抓取研究[D];电子科技大学;2015年
3 姚鑫;分布式手机软件应用搜索爬虫系统设计与实现[D];北京邮电大学;2015年
4 姚富贵;基于分布式的商品信息网络爬虫系统的设计与实现[D];华中科技大学;2014年
5 赵鹏程;分布式书籍网络爬虫系统的设计与实现[D];西南交通大学;2014年
6 苏小鲁;基于DOM的HTML网页正文信息抽取模块的设计与实现[D];北京邮电大学;2011年
7 王星;新闻网页抽取技术的研究与实现[D];河北工业大学;2011年
本文编号:2568839
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2568839.html