顾及时空主题特征的分布式灾害舆情信息获取与分析方法研究
【图文】:
请求访问初始URL并提取其中包含的所有URL地址,将有用的URL放置队列逡逑中以待后续爬取,该过程一直循环直到条件不满足时停止,最后将爬取到的数据逡逑保存管理起来(刘志杰,2017),,具体结构如图2.1所示。逡逑f邋开始逡逑\逦逦y逡逑请求访问逡逑初始URL逡逑卜解析网页逡逑,,逡逑¥取数据,¥取目&URL逡逑故入URL队列逡逑A邋.邋URL队列是否为空?::>逡逑(逦结束邋)逡逑图2.1通用网络爬虫流程图逡逑互联网中的数据规模庞大、结构复杂且更新频率高,网络爬虫通常需要解决逡逑II逡逑
请求访问初始URL并提取其中包含的所有URL地址,将有用的URL放置队列逡逑中以待后续爬取,该过程一直循环直到条件不满足时停止,最后将爬取到的数据逡逑保存管理起来(刘志杰,2017),具体结构如图2.1所示。逡逑f邋开始逡逑\逦逦y逡逑请求访问逡逑初始URL逡逑卜解析网页逡逑,,逡逑¥取数据,¥取目&URL逡逑故入URL队列逡逑A邋.邋URL队列是否为空?::>逡逑(逦结束邋)逡逑图2.1通用网络爬虫流程图逡逑互联网中的数据规模庞大、结构复杂且更新频率高,网络爬虫通常需要解决逡逑II逡逑
【学位授予单位】:浙江大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP391.1;X43
【相似文献】
相关期刊论文 前10条
1 孙晓颖;荆建蕾;刘亚梅;常淑敏;;同伴拒绝儿童的初始沙盘特征分析[J];中国学校卫生;2017年06期
2 钟将;张淑芳;郭卫丽;李雪;;主题特征格分析:一种用户生成文本质量评估方法[J];电子学报;2018年09期
3 邹永利;;学术文献的非主题特征及其意义[J];中国图书馆学报;2011年03期
4 冯维;;论新世纪美国文学的主题特征的转化[J];鸭绿江(下半月版);2015年10期
5 袁毅;主题特征度在核心网站评价中的作用[J];情报杂志;2005年10期
6 杨金才;;论新世纪美国小说的主题特征[J];深圳大学学报(人文社会科学版);2014年02期
7 杨虎涛;;演化经济学的方法和主题特征及其演变——一种以“另类教规理论”为例的解释[J];财经研究;2010年01期
8 陈牧;;城市中公共活动场所的主题特征及形成原理[J];中华建设;2012年09期
9 洪流;曹慧;;欢乐自在[J];中国皮革;2005年24期
10 谭晶;王庆党;;“文革”期间毛泽东主题绘画的主题特征[J];青年文学家;2015年21期
相关会议论文 前2条
1 陈文亮;朱靖波;姚天顺;;企业网络监管系统CNM的设计与实现[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年
2 蔡黎;彭星源;柯登峰;赵军;;少数民族汉语考试作文自动评分的特征提取研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
相关重要报纸文章 前2条
1 记者 陈健;体育产业符合强主题特征[N];上海金融报;2014年
2 山东省青州第二中学 李娟;小小说阅读应考策略[N];学知报;2010年
相关博士学位论文 前2条
1 臧睦君;图像场景识别的特征研究[D];吉林大学;2015年
2 李文峰;基于主题模型的用户建模研究[D];北京邮电大学;2013年
相关硕士学位论文 前10条
1 竺佳芳;顾及时空主题特征的分布式灾害舆情信息获取与分析方法研究[D];浙江大学;2019年
2 李家乐;基于深度学习的问题回答技术研究[D];北方工业大学;2019年
3 曾庆旺;基于ResearchGate的科研合作者推荐研究与实现[D];北京交通大学;2018年
4 郑灶旭;基于主题特征和深度学习的情感分析算法研究[D];华南理工大学;2018年
5 秦雨;基于主题特征的专家关系网络构建方法研究[D];昆明理工大学;2015年
6 梁霄;博物馆主题式设计实践研究[D];延边大学;2014年
7 苏庭波;产品评论的意见倾向分类技术研究[D];安徽工业大学;2011年
8 易金锋;营造景区主题特征的建筑设计手法研究[D];西安建筑科技大学;2010年
9 高洁;基于主题特征的情感分类及推荐算法研究[D];天津大学;2016年
10 王晶;新时期以来中国大陆电影的“行走叙事”研究[D];山东师范大学;2015年
本文编号:2667980
本文链接:https://www.wllwen.com/kejilunwen/anquangongcheng/2667980.html