Web时空数据挖掘及其地图信息服务
本文选题:Web时空数据挖掘 + 网络爬虫 ; 参考:《华东师范大学》2013年硕士论文
【摘要】:随着计算机和网络技术的迅速发展,尤其移动互联网的崛起,Web已成为知识获取和信息传输不可或缺的渠道。Web2.0技术的出现,使互联网的使用产生了革命性转变,即每个用户从单纯的访问者转变成了潜在的信息发布者。因此,Web资源蕴含着大量社会行为和自然事件方方面面的信息,从中挖掘带有时空信息的数据,可作为社会研究的重要素材。同时Web技术的发展也推动着地理信息技术的前进,WebGIS是地理信息技术和Web技术发展到一定阶段的结合产物。它以服务大众为宗旨,能够作为时空数据和相关知识展示的平台。 本文拟从网络资源中抓取感兴趣的半结构化网页文本,经过时空信息抽取和整理等处理步骤,形成结构化的时空数据,以数据库形式进行存储。之后将多种时空数据源进行整合,利用时空数据挖掘技术,发现这些数据中隐含的知识和规则。在知识表达方面,应用WebGIS地图可视化的方式展示统计分析得到的时空数据和数据挖掘得到的知识。根据以上思路,本文分为六个章节: 第二章探讨研究的背景和意义,同时对国内外的相关研究进展做了综述,同时论述本文的研究内容和目标,最后确定论文架构。 第二章概述数据挖掘及其分支Web数据挖掘、空间数据挖掘、时空数据挖掘、Web数据挖掘和Web时空数据挖掘的概念和基础理论。最后介绍地理信息系统及其分支WebGIS的相关概念。 第一章介绍本研究的主要技术和算法,其中包括HTTP、URL地址、网络爬虫、网页解析、分词技术和Apriori算法。最后讨论本研究用到的一些工具。 第四章选取中国天气网和新浪微博网站作为例子,介绍网页数据下载,时空信息的抽取、整理、入库及变换,时空关联规则表的建立,以及如何利用Apriori算法计算气象数据和交通事故之间的关联规则。最后讲述系统实现的功能和向用户提供的服务。 第五章总结回顾全文,概括研究成果和创新点,同时指出本文的不足和下一步需做的工作。
[Abstract]:With the rapid development of computer and network technology, especially the rise of mobile Internet, Web has become an indispensable channel for knowledge acquisition and information transmission. Web 2.0 technology has revolutionized the use of the Internet. That is, each user changes from a simple visitor to a potential publisher of information. Therefore, Web resources contain a large number of social behavior and natural events of all aspects of information, mining from the data with space-time information, can be used as an important material for social research. At the same time, the development of Web technology also promotes the advance of geographic information technology. WebGIS is the combination of geographic information technology and Web technology. It aims to serve the public and can serve as a platform for the display of spatiotemporal data and related knowledge. This paper intends to grab the interested semi-structured web page text from the network resources, and through processing steps such as extracting and sorting out space-time information, forms structured spatio-temporal data and stores it in the form of database. After that, a variety of spatio-temporal data sources are integrated, and the knowledge and rules hidden in these data are found by using spatio-temporal data mining technology. In the aspect of knowledge representation, WebGIS map visualization is used to display the spatiotemporal data and the knowledge obtained from data mining. According to the above ideas, this paper is divided into six chapters: The second chapter discusses the background and significance of the research, at the same time summarizes the related research progress at home and abroad, at the same time discusses the research contents and objectives of this paper, and finally determines the structure of the paper. The second chapter summarizes the concepts and basic theories of data mining and its branch Web data mining, spatial data mining, space-time data mining and Web space-time data mining. Finally, the concepts of GIS and its branch WebGIS are introduced. The first chapter introduces the main technologies and algorithms of this study, including HTTP URL address, web crawler, web page parsing, word segmentation and Apriori algorithm. Finally, some tools used in this study are discussed. The fourth chapter selects China Weather Network and Sina Weibo website as examples, introduces web page data download, space-time information extraction, sorting, storage and transformation, the establishment of time-space association rules table. And how to use Apriori algorithm to calculate the association rules between meteorological data and traffic accidents. At last, the function of the system and the service to the user are described. Chapter five summarizes and reviews the full text, summarizes the research results and innovations, and points out the shortcomings of this paper and the work to be done in the next step.
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:P208;TP311.13
【参考文献】
相关期刊论文 前10条
1 胡军伟;秦奕青;张伟;;正则表达式在Web信息抽取中的应用[J];北京信息科技大学学报(自然科学版);2011年06期
2 陈晓宁;马亚飞;谢孟利;;基于NewMap API的Web地图服务系统应用[J];测绘标准化;2011年03期
3 吴运超;牛铮;黄茂军;林文鹏;;利用Web挖掘技术改善公众网络地图查询服务[J];测绘科学;2007年03期
4 赵彬彬;李光强;邓敏;;时空数据挖掘综述[J];测绘科学;2010年02期
5 吴运超;王汶;牛铮;宋国君;;Ajax在WebGIS中的应用[J];地理与地理信息科学;2007年02期
6 徐胜华;刘纪平;胡明远;;空间数据挖掘与发展趋势探讨[J];地理与地理信息科学;2008年03期
7 张雪伍;苏奋振;石忆邵;张丹丹;;空间关联规则挖掘研究进展[J];地理科学进展;2007年06期
8 曹忠;赵文静;;一种优化的网络爬虫的设计与实现[J];电脑知识与技术;2008年35期
9 苏奋振,杜云艳,杨晓梅,刘宝银;地学关联规则与时空推理的渔业分析应用[J];地球信息科学;2004年04期
10 孙嘉;裴韬;龚玺;周成虎;;Web时空数据挖掘研究进展[J];地球科学进展;2011年04期
相关博士学位论文 前2条
1 舒永钢;WebGIS旅游信息搜索功用研究及应用[D];浙江工商大学;2012年
2 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
,本文编号:1899651
本文链接:https://www.wllwen.com/kejilunwen/dizhicehuilunwen/1899651.html