逻辑回归空间加权技术及其在矿产资源信息综合中的应用

发布时间:2017-09-17 09:15

  本文关键词:逻辑回归空间加权技术及其在矿产资源信息综合中的应用


  更多相关文章: GIS空间分析 空间加权 逻辑回归 证据权 各向异性 缺失数据 矿产资源信息综合


【摘要】:综合地质、地球化学、地球物理以及遥感等多方数据是提高成矿预测的精度重要途径。自国际地球科学联合会1978年推荐6种矿产资源评价与预测方法以来,各种信息综合方法被引入成矿预测。由于成矿预测是对矿床是否发生这一二值事件进行的预测,以后验概率为计算结果的log-linear模型被广泛应用于矿产资源预测与评价领域。目前证据权和逻辑回归是矿产资源评价与预测中最常见的信息综合定量方法。与传统统计预测不同的是,成矿预测属于空间统计预测范畴,表现在成矿预测要素和成矿事件具有空间位置属性。矿产资源定量预测和评价很早就开始基于GIS平台进行,并且一些预测要素的构建是通过空间叠加分析、缓冲区分析等得到的。然而,一些更加复杂形式的空间关系并未在预测模型中得到有效表达,如空间变量的集聚性和趋势性。地质过程的复杂性和成矿作用的多期次性使得成矿预测要素的空间分布呈结构性、非平稳性和奇异性,基于经典统计方法建立的成矿信息提取和综合模型往往存在偏差。加拿大地质调查局Agterberg教授于上个世纪60年代末至70年代初就注意到矿产资源预测中些地质变量具有空间趋势,并会造成预测结果存在系统误差,对此他提出在预测模型中引入位置变量以构建不同阶的空间趋势。我国学者成秋明教授则关注到矿点分布具有空间集聚性,这种集聚性具有分形分布特点,为此提出了分形证据权模型。近年来,地理加权回归模型在经济地理学领域兴起。该模型采用基于邻近样点建立的模型对当前点进行预测,且邻近程度被转化为样点在预测模型中的权重。这实际上是一种融合了地理学第一定律的空间变系数模型。由于采用了局部窗口的思想,地理加权回归模型有效克改善了全局模型不能很好克服空间非平稳性的缺点。相比于地理加权线性回归模型,地理加权逻辑回归模型在矿产资源定量预测预评价领域还鲜有报道。如前所述,成矿预测的研究对象属于二值事件,log-linear模型显然更适用。因此本文将在成矿预测中引入地理加权逻辑回归模型。广义来说,地理加权属于空间加权的一种形式,后者还包括基于感兴趣目标的加权,以及基于研究程度的加权等。由于在成矿预测中存在着研究区勘查程度的差异,在建立预测模型时对研究区笼统对待是不科学的。本研究将考虑区域研究程度差异,并量化为空间权重。因此,本研究所指空间加权技术实际上包含了局部窗口权重和全局权重两部分,前者通过地理权重体现,后者则表现在研究区勘探程度或感兴趣目标等差异。缺失数据是包括成矿预测在内所有空间评价与预测领域常见的一个问题,缺失数据的常见处理方法有三种,一是去除含有缺失数据的样本,二是去除含有缺失数据的变量,三是用变量均值代替缺失值。证据权模型提供了另外一种解决方案,它用正负权重代替原始的1和0值,并用0权重代替缺失值。相比于去除含有缺失值的样本或变量,平均值方案和证据权方案显然避免了不必要的信息丢失;而前人研究表明,证据权缺失数据处理方案优于平均值。此外,证据权模型还包含了一套连续变量二值化(离散化)方案,在成矿预测中被广泛采用。本研究所开发的空间加权逻辑回归模块采用了证据权模型中缺失数据处理和离散变量二值化的做法。条件独立性是成矿预测证据权模型的基本假设前提。如果不满足这一假设,不仅会造成后验概率估计值的绝对偏差,也会造成后验概率排序的差异,进而影响远景靶区圈定。逻辑回归模型则无需条件独立性假设,它需要满足相对宽松的假设。本研究所发展的空间加权逻辑回归模型实际上融合了证据权和逻辑回归两种模型的上述优点,并且赋予其空间加权模型的特点。本研究的具体内容为:(1)成矿预测中常用log-linear模型各自优缺点及相互关系研究朴素贝叶斯模型是证据权模型和逻辑回归模型等log-linear模型的基础模型,这三种模型有各自不同的基本假设和适用条件。一些文献将证据权模型与朴素贝叶斯模型的基本假设等同是错误的,它们忽略了证据权模型对于条件独立性的进一步放宽,实际上证据权模型需要满足的是一种弱条件独立性假设。尽管如此,想要满足证据权模型的基本假设仍然有一定困难。而逻辑回归模型所需基本假设进一步放宽。由于采用极大似然法对后验概率进行估计,即使在不满足条件独立性假设或弱条件独立性假设的条件下,逻辑回归也总能得到预测矿点数与实际矿点数相等的结果。证据权模型具有形式简单和易于操作等优点,并且提供了缺失数据处理和数据离散化(二值化)功能,其最大缺点就是需要满足(弱)条件独立性假设,因此一些学者希望借鉴其它模型对其进行改进,这其中就包括借鉴逻辑回归对证据权模型进行改进的研究。Deng(2009)的改进模型可以在一定程度削不满足弱条件独立性假设对预测模型的影响,但是该改进模型存在数学推导错误.Agterberg(2011)的改进模型真正融合了证据权与逻辑回归这两种模型,该模型实际上既包含基于逻辑回归模型对证据权模型的改进,也包含基于证据权模型对逻辑回归模型的改进,两者结果完全等价。在没有缺失数据存在的情况下,Agterberg (2011)的改进模型与一般逻辑回归模型等价;当存在缺失数据时,该改进模型优于一般的逻辑回归模型。而透过该改进模型还可以建立证据权模型与逻辑回归模型之间的关系,本研究将采用这种融入证据权和逻辑回归两种模型特点的改进模型,并与空间加权技术结合,成为新的空间加权逻辑回归模型。(2)空间加权技术与成矿信息综合详细论述了空间非平稳性对于成矿信息提取、综合预测和覆盖区找矿的影响,论证成矿预测中采用空间加权技术的理论依据和现实意义。回顾了前人对空间非平稳性的研究,以及对空间变量趋势性、结构性和奇异性特点所采取的应对措施,讨论了现有空间加权技术的形式和特点,包括地理加权和感兴趣目标加权等。由于成矿预测中使用的变量具有空间非平稳性,需要考虑空间趋势对于预测结果的影响;由于成矿预测区存在勘察程度的差异,需要考虑样本之间的差异性。因此,引入空间加权技术是十分必要。最后讨论了空间加权的具体形式。(3)逻辑回归空间加权技术实现和软件模块开发首先在数学层面讨论了空间加权逻辑回归技术的实现,包括地理权重的计算、研究程度权重的计算以及两种权重的综合。接着叙述了空间加权逻辑回归模型的功能设计过程,包括变量数据二值化(离散化)的实现、缺失数据的处理方案,同时提供了基于地质统计学变差函数模型确定局部窗口大小、形状和权重衰减形式的方案,以及基于空间t统计量的带宽优化方案。最后介绍了具体的算法设计和实现,包括局部窗口参数的设计和模板的构建,以及该模块实现的整体流程。(4)实例研究和对比研究以加拿大新斯科舍省西南Rossignol湖周围地区浊积岩型金矿成矿预测为例,详细阐述了逻辑回归空间加权技术在矿产资源信息综合中的应用。同时基于空间t统计量和预测效率比较了空间加权逻辑回归模型与证据权模型、逻辑回归模型在成矿预测中的表现。此外在人为构建了缺失数据环境下,比较了这些模型的预测效果。结果显示,空间加权逻辑回归模型在本案例中的表现全面优于基于全局数据建立的证据权模型和逻辑回归模型。论文的主要创新点如下:(1)使用GIS空间加权技术对加权逻辑回归模型进行扩展,以更好处理空间非平稳和各向异性环境下的矿产资源信息综合预测。所使用的空间加权技术包含了地理加权和其它形式加权,如研究区勘察程度。(2)探索空间各向异性加权方案,并以地质统计学空间变异函数模型确定地理加权模型中的带宽和衰减权重。(3)该模型还融合了证据权模型对于缺失数据处理和变量图层二值化(离散化)的功能。
【关键词】:GIS空间分析 空间加权 逻辑回归 证据权 各向异性 缺失数据 矿产资源信息综合
【学位授予单位】:中国地质大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:P612
【目录】:
  • 作者简介6-9
  • 摘要9-12
  • ABSTRACT12-19
  • 第一章 绪论19-32
  • §1.1 研究背景和意义19-20
  • §1.2 国内外研究现状20-30
  • 1.2.1 矿产资源定量预测信息综合方法研究进展20-22
  • 1.2.2 空间加权技术研究进展22-24
  • 1.2.3 发展趋势与存在的问题24-30
  • §1.3 研究内容和研究思路30-32
  • 1.3.1 研究内容30
  • 1.3.2 研究思路30-32
  • 第二章 成矿预测Log-linear定量模型32-50
  • §2.1 从朴素贝叶斯到证据权和逻辑回归32-38
  • 2.1.1 朴素贝叶斯模型32-33
  • 2.1.2 证据权模型33-35
  • 2.1.3 逻辑回归模型35-38
  • §2.2 证据权与逻辑回归关系探讨38-43
  • 2.2.1 基本假设38-40
  • 2.2.2 证据权与逻辑回归模型间的定量关系40-42
  • 2.2.3 证据权和逻辑回归模型优缺点对比42-43
  • §2.3 证据权模型与逻辑回归模型的融合43-49
  • 2.3.1 Deng(2009)改进证据权模型及存在问题43-46
  • 2.3.2 Agterberg(2011)修正证据权模型46-47
  • 2.3.3 Agterberg(2011)模型与逻辑回归模型等价关系证明47-49
  • §2.4 小结49-50
  • 第三章 空间加权技术与成矿信息综合50-61
  • §3.1 地质变量空间非平稳性对成矿预测的影响50-53
  • 3.1.1 空间非平稳性对成矿信息提取的影响50-51
  • 3.1.2 空间非平稳性对综合预测模型的影响51-52
  • 3.1.3 空间非平稳性对覆盖区成矿预测的影响52-53
  • §3.2 空间非平稳性研究进展53-57
  • 3.2.1 空间趋势变量回归模型53-54
  • 3.2.2 局部奇异性分析技术54-55
  • 3.2.3 地理加权回归55-57
  • §3.3 空间加权形式57-61
  • 3.3.1 滑动窗口加权57-59
  • 3.3.2 感兴趣目标加权59-60
  • 3.3.3 研究程度加权60-61
  • 第四章 空间加权逻辑回归61-74
  • §4.1 模型数学表达61-62
  • 4.1.1 地理加权逻辑回归模型61
  • 4.1.2 空间加权逻辑回归模型61-62
  • §4.2 模型功能设计62-66
  • 4.2.1 窗口级别的数据二值化方案62-63
  • 4.2.2 基于证据权权重的缺失数据处理方案63-64
  • 4.2.3 基于变差函数的权重衰减模型64-65
  • 4.2.4 基于空间t统计量的带宽优化方案65-66
  • §4.3 算法设计与实现66-74
  • 4.3.1 局部窗口设计66-69
  • 4.3.2 空间加权逻辑回归算法69-71
  • 4.3.3 模块界面设计71-72
  • 4.3.4 空间加权逻辑回归基本流程72-74
  • 第五章 加拿大新斯科舍省金矿成矿预测74-105
  • §5.1 研究区概况74-77
  • 5.1.1 区域地质与构造75
  • 5.1.2 区域岩浆岩75
  • 5.1.3 区域成矿75
  • 5.1.4 区域数据75-77
  • §5.2 预测要素图层构建77-80
  • 5.2.1 背斜构造77
  • 5.2.2 地层接触关系77
  • 5.2.3 区域地球化学数据分析77-80
  • §5.3 综合预测80-97
  • 5.3.1 基于证据权模型的综合预测80-86
  • 5.3.2 基于逻辑回归模型的综合预测86-88
  • 5.3.3 基于空间加权逻辑回归模型的综合预测88-97
  • §5.4 预测模型结果评价97-104
  • 5.4.1 基于空间t统计量的预测模型评价98-99
  • 5.4.2 基于预测效率的预测模型评价99-100
  • 5.4.3 考虑缺失数据的预测模型评价100-104
  • §5.5 小结104-105
  • 第六章 结论与展望105-107
  • §6.1 主要结论和创新点105-106
  • 6.1.1 主要结论105
  • 6.1.2 创新点105-106
  • §6.2 存在问题与展望106-107
  • 致谢107-109
  • 参考文献109-122
  • 附录A 部分关键函数源代码122-139

【参考文献】

中国期刊全文数据库 前4条

1 赵鹏大;“三联式”资源定量预测与评价——数字找矿理论与实践探讨[J];地球科学;2002年05期

2 成秋明;赵鹏大;张生元;夏庆霖;陈志军;陈建国;徐德义;王文磊;;奇异性理论在个旧锡铜矿产资源预测中的应用:综合信息集成与靶区圈定[J];地球科学(中国地质大学学报);2009年02期

3 Daimaru HIROMU;Abe KAZUTOKI;Kurokawa USIO;Matsuura SUMIO;;Modeling the potential distribution of shallow-seated landslides using the weights of evidence method and a logistic regression model:a case study of the Sabae Area, Japan[J];International Journal of Sediment Research;2008年02期

4 王志旺;李端有;王湘桂;;证据权法在滑坡危险度区划研究中的应用[J];岩土工程学报;2007年08期

中国博士学位论文全文数据库 前1条

1 罗罡辉;基于GWR模型的城市住宅地价空间结构研究[D];浙江大学;2007年



本文编号:868553

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jckxbs/868553.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户83462***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com