基于社交媒体地理数据进行面向对象的土地利用分类研究
发布时间:2021-08-12 00:07
对许多领域的研究,城市的土地利用数据不可或缺,如何获取高精度的土地利用分类数据,向来是相关领域的难点与热点,颇具实用价值。面向对象的分类方法被广泛用于精细的土地利用分类研究中,成果斐然,但已有方法依赖于高分辨率遥感影像的解译,极大限制了这种方法的实用性。社交网络服务、空间信息服务及通信技术的发展,催生出海量的社交媒体地理数据。作为海量地理信息时代的重要组成部分,社交媒体地理数据具有传统数据源难以比拟的优势:包含丰富的时空及文本信息、体量大、更新速度快、与人群活动息息相关、开源、易于获取等,利用社交媒体地理数据,可以再现庞大用户群的生活轨迹对于不同土地利用类型的地区,人群将呈现出不同的活动状况。通过挖掘社交媒体地理数据中的时空及文本信息,掌控人群活动的时空模式,及其活动相关主题情况,进行面向对象的土地利用分类,将取得精度较高的土地利用信息。在充分调研已有研究的基础上,本文提出一种面向对象的分类方法,将对象定义为地块(Land Parcel),通过分析地块内的社交媒体地理数据,识别土地利用类型。为此,选取典型的Twitter数据,进行了实例分析:依托地理信息系统(Geographic In...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图2.1技术路线图??
MLP是一种经典的神经网络算法,本研究拟选取这种算法构建分类模型。??MLP由多层非线性神经元组成,包括输入、输出、及若干隐藏层,层中的神经??元与相邻层相互连接,其结构如图2.2所示。MLP中,互相连接的神经元之间??间的关联程度通过权重衡量。外部的数据通过输入层传入模型(White?and??Rosenblatt?1963?)。在其训练过程中,釆用反向传播(Backpropagation)技术处??理传入的向量数据,通过不断重复输入层-隐藏层-输出层的正向过程与输出层-??隐藏层-输入层的反向过程,反复调整权重,直到输出结果达到收敛,则训练完??成(RumelhartandHinton,?1988)。模型构建的两个主要过程如下:??①
?3实例分析??经重分类后,研究区域内的地块绝大多数为居住类型,其次为公共机构,??交通与工业用地最少。各类地块在总地块数中的具体比例如下图3.1所示。??比例??〇.fb7—\?^〇.〇15??0.015?°-04/??00.024??口商业口工业□公共机构口办公0居住口交通口未开发??图3.1各类型的地块占总地块数的比例??3.2.2社交媒体地理数据??鉴于研究区位于美国,而Twitter是美国境内最流行的社交应用之一,本研??究以带有地理坐标的Twitter数据为例进行研究,并利用R中的streamR包获取??Twitter数据。streamR提供一系列功能,通过该包能够访问Twitter的过滤器、??样本及用户流,并将输出结果解析为数据框,保存到文件中。基于这一包,获??取从2014年3月6日到3月13日,及4月8日到4月17日两段时间内,共计??811393条数据,每条数据的组织形式如:丨推文编号,用户ID,文本内容,时??间记录,经度,纬度,地名等}。利用Geodatabase数据库对原始数据进行初步??的预处理:??1、删除文件中信息不完全的无效点;??2、坐标转换
本文编号:3337167
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:69 页
【学位级别】:硕士
【部分图文】:
图2.1技术路线图??
MLP是一种经典的神经网络算法,本研究拟选取这种算法构建分类模型。??MLP由多层非线性神经元组成,包括输入、输出、及若干隐藏层,层中的神经??元与相邻层相互连接,其结构如图2.2所示。MLP中,互相连接的神经元之间??间的关联程度通过权重衡量。外部的数据通过输入层传入模型(White?and??Rosenblatt?1963?)。在其训练过程中,釆用反向传播(Backpropagation)技术处??理传入的向量数据,通过不断重复输入层-隐藏层-输出层的正向过程与输出层-??隐藏层-输入层的反向过程,反复调整权重,直到输出结果达到收敛,则训练完??成(RumelhartandHinton,?1988)。模型构建的两个主要过程如下:??①
?3实例分析??经重分类后,研究区域内的地块绝大多数为居住类型,其次为公共机构,??交通与工业用地最少。各类地块在总地块数中的具体比例如下图3.1所示。??比例??〇.fb7—\?^〇.〇15??0.015?°-04/??00.024??口商业口工业□公共机构口办公0居住口交通口未开发??图3.1各类型的地块占总地块数的比例??3.2.2社交媒体地理数据??鉴于研究区位于美国,而Twitter是美国境内最流行的社交应用之一,本研??究以带有地理坐标的Twitter数据为例进行研究,并利用R中的streamR包获取??Twitter数据。streamR提供一系列功能,通过该包能够访问Twitter的过滤器、??样本及用户流,并将输出结果解析为数据框,保存到文件中。基于这一包,获??取从2014年3月6日到3月13日,及4月8日到4月17日两段时间内,共计??811393条数据,每条数据的组织形式如:丨推文编号,用户ID,文本内容,时??间记录,经度,纬度,地名等}。利用Geodatabase数据库对原始数据进行初步??的预处理:??1、删除文件中信息不完全的无效点;??2、坐标转换
本文编号:3337167
本文链接:https://www.wllwen.com/jingjilunwen/nongyejingjilunwen/3337167.html