当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于文本地理信息提取的平台服务与应用研究

发布时间:2017-06-01 11:12

  本文关键词:基于文本地理信息提取的平台服务与应用研究,由笔耕文化传播整理发布。


【摘要】:毫无疑问,我们现在已经跨入信息时代,数据时代人们需要查阅和检索的信息量也在与日俱增,那么怎样浩如烟海的数据世界里找到其所需的信息就变成了一个越来越重要需要研究的课题当今,要处理与日俱增的信息,仅仅通过人工和简单数据库的方式费时费力且不太现实我们需要一种更加智能可靠的方式,更智能的帮助人们查找处理信息数据,来解决其信息量丰富而知识贫乏的矛盾诚然,目前已经出现了很多智能的工具如自动摘要自动文件检索等语言处理技术,在这些技术内的一个核心关键是主题词,对于主题词的提取有助于简化此类工作,而如何找到主题词是需要分词技术的这也就是当前搜索引擎,智能翻译工具的技术核心 分词技术,顾名思义,就是借助计算机自动给文本划分主题词,使其能够正确表达所要表达的意思同时,值得注意的是,中文不同于西文,没有空格这个分隔符,同时在中文中充满了大量的同义词,相近词,所以如何给中文分词是个非常复杂的问题同时也是一个涉及到语言学逻辑学计算机科学自然语言处理认知科学心理学等诸多领域的技术 数据挖掘技术,是从不同角度分析数据,并总结成有用信息的过程,是一个具有巨大潜力的新兴技术,能够帮助企业收集到他们想要的有关客户或者潜在客户的重要信息绝大部分的网络应用都是基于数据库来实现,用户数据日益累和科技的更新,最终让我们进入大数据时代,如果通过揭露数据与数据之间看似毫无关系的秘密隐藏联系,通过对过去数据的专注预测未来可能发生的事情,挖掘其中的价值就是数据挖掘被赋予的重要使命 空间数据挖掘技术,又称空间数据挖掘和知识发现,是为了解决空间数据海量特性而扩展的一个新的数据挖掘研究分支,是指从空间数据库中提取隐含的用户感兴趣的空间或非空间的模式和普遍特征的过程空间数据挖掘的对象主要是空间数据库,而空间数据库中不仅存储了空间事物或对象的几何位置形状数据属性数据之外,而且还包含了空间事物或对象之间的空间拓扑关联关系; 地理可视化技术,使用具体的视觉表达(表现媒质是纸计算机或者其他介质)来使空间环境和问题可视化,从而最大限度地利用与人类视觉能力相关的信息处理能力,通过结合科学可视化,制图学和GIS发展起来的研究方向,目的在于通过 系列可视化技术使得用户更好地理解空间数据,有利于进一步探索分析空间数据。到目前为止,计算机的识别能力仍然不如人类的视觉观察能力,人类可以迅速而准确地从图形图像中发现特定的数据分布模式。特别是在地理环境下,人们习惯处于一个可视化的环境中分析处理与空间相关的问题。由于结合了人敏锐的观察能力以及可能的用户专业知识,交互可视化的SDM可以使得数据挖掘过程成为一个互动、可视化、易于理解的重复过程,而不是完全自动的暗箱操作。这一点对于空间数据的探索分析尤为重要。一般而言,人机交互是最为重要的可视化技术之一,即时的交互使得空间数据分析和知识发现变得更为人性化和专业化。因此,地理可视化对于帮助我们分析当前数据和问题,思考解决问题的方法策略,表达和解译空间分析结果都有十分特殊的意义 那么综上所述,所谓文本地理信息提取,就是分词技术和空间地理信息有机结合的衍生,也是空间数据挖掘技术在地理信息领域中的一种具体应用的体现。本文首先对分词技术,数据挖掘和空间数据挖掘技术,地理可视化等技术的概念特点介绍阐述。然后基于这些技术,衍生出文本地理信息提取技术并进行了详细技术路线和实现过程分析。 本研究所做的主要工作如下:(1)研究分词技术,借助开源算法,集成开发环境,轻量级中文分词API,地理信息系统建立简单数据处理模型,针对地理信息应用方面做深入优化,提取文本地理信息。 (2)研究数据挖掘技术,尤其是空间数据挖掘技术,针对空间数据库,研究空间事物或对象之间的空间拓扑关联关系。探索事物之间的内在联系,建立简单空间数据模型。 (3)研究地理信息可视化技术,通过前面研究的数据成果对其进行可视化处理,构建简单交互模型。 (4)最后对文本地理信息构建成内容服务以及深入应用的可行性进行探究。 在研究过程中,所取得的创新点如下: (1)提出了一种文本地理信息提取的方法。基于分词技术,特别是就汉语言特点的中文分词技术,提出针对文本地理信息特定优化的分词技术,从而提取文本地理信息,使文本地理分词精度和处理速度达到较优。 (2)提出了一种基于距离的电子地图标记聚类算法。当前主流算法是基于网格的标记聚类,其算法优点是速度快,实现简单,但是精度不够高,误差分布广。 (3)构建了一个针对空间地理信息的简单数据挖掘模型。数据挖掘作为一门新兴技术在当今的研究中更多的是一些理论性质的研究,特别是在地理信息领域鲜有建树,,本文从实践的角度探寻和阐述其重要意义
【关键词】:中文分词 空间数据挖掘 地理信息可视化 地理信息提取 基于距离的电子地图标记聚类
【学位授予单位】:成都理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP391.1
【目录】:
  • 摘要4-7
  • Abstract7-12
  • 第1章 绪论12-23
  • 1.1 研究意义及背景12-14
  • 1.1.1 研究意义12
  • 1.1.2 自然语言处理12
  • 1.1.3 分词技术12
  • 1.1.4 数据挖掘技术12-14
  • 1.1.5 地理信息可视化14
  • 1.1.6 文本地理信息提取及显示14
  • 1.2 国内外研究现状14-20
  • 1.2.1 自然语言处理技术难点14-15
  • 1.2.2 中文分词研究方法和技术瓶颈15-18
  • 1.2.3 数据挖掘和地理信息可视化研究现状18-20
  • 1.3 课题来源20
  • 1.4 研究内容20-21
  • 1.5 技术路线21
  • 1.6 研究过程中所取得的创新和研究成果有:21-22
  • 1.7 论文组织结构22-23
  • 第2章 文本地理信息关键字提取23-42
  • 2.1 文本地理信息初步提取24-35
  • 2.1.1 原子切分24-25
  • 2.1.2 1-最短路径粗切分25-30
  • 2.1.3 N-最短路径粗切分30-31
  • 2.1.4 初步分词31-35
  • 2.2 复合识别策略35-42
  • 2.2.1 数字和日期合并等策略35-36
  • 2.2.2 人名和地名识别策略36-38
  • 2.2.3 词性标注和最终结果38-39
  • 2.2.4 数据词典结构与构成模型39-42
  • 第3章 电子地图标记簇研究42-53
  • 3.1 电子地图标记簇的聚类43-45
  • 3.2 地图视窗管理模式45-47
  • 3.3 电子地图标记簇聚类算法研究47-50
  • 3.3.1 基于网格的聚类算法47-49
  • 3.3.2 基于距离的聚类算法49-50
  • 3.4 电子地图标记簇的应用50-53
  • 第4章 基于地理信息的文本挖掘模型构建53-64
  • 4.1 文本挖掘概念介绍53-54
  • 4.2 基于地理信息的文本挖掘过程54-56
  • 4.3 文本挖掘关键技术56-57
  • 4.4 基于地理信息的文本挖掘技术应用研究57-64
  • 第5章 基于文本地理信息提取的平台服务设想64-68
  • 5.1 面向服务架构(SOA-service-oriented architecture)64-65
  • 5.2 Web service65-66
  • 5.3 基于文本地理信息的 SOA 架构66-68
  • 结论68-70
  • 致谢70-71
  • 参考文献71-73
  • 攻读学位期间取得的学术成果73

【相似文献】

中国期刊全文数据库 前10条

1 王树良,史文中,李德毅,王新洲;用云解释空间数据挖掘的有关问题[J];计算机工程与应用;2003年24期

2 徐胜华;刘纪平;胡明远;;空间数据挖掘与发展趋势探讨[J];地理与地理信息科学;2008年03期

3 胡圣武;李鲲鹏;;空间数据挖掘的方法进展及其问题分析[J];地球科学与环境学报;2008年03期

4 王新华;米飞;冯英春;赵玮;;空间数据挖掘技术的研究现状与发展趋势[J];计算机应用研究;2009年07期

5 潘燕芳;王庆光;;空间数据挖掘技术研究[J];福建电脑;2010年02期

6 郭学军;;基于空间数据挖掘器的空间数据挖掘系统设计[J];煤炭技术;2011年05期

7 廖美红;;基于空间数据挖掘的煤矿安全监测系统[J];制造业自动化;2012年24期

8 李丹,高丽;空间数据挖掘技术[J];湖北汽车工业学院学报;1999年03期

9 马健;;一种新的空间数据挖掘系统的分析与研究[J];安康学院学报;2014年02期

10 刘宇,曲波,朱仲英,施颂椒;空间数据挖掘理论与方法的研究[J];微型电脑应用;2000年08期

中国重要会议论文全文数据库 前10条

1 孙成忠;赵润怀;陈士林;哈丹朝鲁;刘召芹;;基于聚类的空间数据挖掘技术在中药资源分析中的应用[A];全国第8届天然药物资源学术研讨会论文集[C];2008年

2 郭达志;何彬彬;;空间数据挖掘及其不确定性研究[A];煤炭资源高效绿色开采与数字矿山学术讨论会论文集[C];2005年

3 王辉;;城市空间数据挖掘方法的研究[A];山东省测绘学术年会论文集[C];2006年

4 贾泽露;刘耀林;;可视化空间数据挖掘研究综述[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年

5 王锐;马德涛;刘晓辉;;基于网格的空间数据挖掘研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年

6 肖予钦;张巨;陈荦;景宁;;空间数据挖掘的索引和数据访问方法研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

7 彭冶红;王军;熊辉;;地球空间数据挖掘与知识发现[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年

8 何撼东;王心源;;地下空间数据挖掘与虚拟现实[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年

9 徐启昌;裴健;柴玮;陶有东;杨冬青;唐世渭;;基于空间数据挖掘的客户分析系统原型CASDM[A];第十六届全国数据库学术会议论文集[C];1999年

10 王锐;马德涛;;GIS-T中的空间数据挖掘研究[A];中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C];2007年

中国重要报纸全文数据库 前3条

1 中国科学院计算技术研究所 刘毅勇 何雄 李金山 廖浩均 孟亮 邓柱中;空间数据挖掘:变数据为知识[N];计算机世界;2005年

2 王锐 白玲 龙波 马德涛;何为空间数据挖掘[N];中国测绘报;2007年

3 张晶晶;地理国情监测须“靠谱”[N];中国矿业报;2013年

中国博士学位论文全文数据库 前10条

1 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年

2 张志兵;空间数据挖掘关键技术研究[D];华中科技大学;2004年

3 胡彩平;基于空间自相关的空间数据挖掘若干关键技术的研究[D];南京航空航天大学;2007年

4 陈桂芬;面向精准农业的空间数据挖掘技术研究与应用[D];吉林大学;2009年

5 贾俊杰;空间数据挖掘中若干关键技术研究[D];长安大学;2009年

6 王占全;基于地理信息系统空间数据挖掘若干关键技术的研究[D];浙江大学;2005年

7 李新运;城市空间数据挖掘方法与应用研究[D];山东科技大学;2004年

8 樊明辉;空间数据挖掘及其可视化系统若干关键技术研究[D];中国科学院研究生院(遥感应用研究所);2006年

9 席景科;时空孤立点检测算法研究[D];中国矿业大学;2010年

10 傅明;基于Web的空间数据挖掘研究[D];中南大学;2004年

中国硕士学位论文全文数据库 前10条

1 崔莹;多源地质空间数据挖掘方法及应用[D];电子科技大学;2011年

2 刘然;定性空间推理与空间数据挖掘技术[D];重庆大学;2003年

3 杨坤;基于空间数据挖掘的超市选址决策研究[D];青岛大学;2008年

4 杨清丽;基于空间数据挖掘的战场地理环境分析系统研究[D];重庆大学;2008年

5 李志建;空间数据挖掘原型系统开发及其应用研究[D];中国地质大学(北京);2009年

6 杨苏宁;空间数据挖掘在城市地理信息系统中的应用[D];江苏科技大学;2010年

7 李国锋;空间数据挖掘技术研究[D];西安电子科技大学;2005年

8 王凌;空间数据库的空间数据挖掘技术研究[D];西安电子科技大学;2005年

9 吴强;空间数据挖掘中的分类方法及其应用研究[D];山东大学;2005年

10 廖晓玉;空间数据挖掘在地表水水质评价与预测中的应用研究[D];东北师范大学;2006年


  本文关键词:基于文本地理信息提取的平台服务与应用研究,由笔耕文化传播整理发布。



本文编号:412461

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/412461.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4556a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com