数据挖掘技术在全球恐怖主义数据库中研究与应用
发布时间:2021-03-08 08:58
随着全球恐怖主义事件的频繁发生,安全领域逐渐受到各国重视,虽然各国对恐怖分子进行了打击,但全球的恐怖活动依旧有增无减。因此,如何用数据挖掘方法以最小的代价进行反恐信息挖掘变得愈加重要。本文对GTD中1998-2017年恐袭数据,主要从三个方面对数据进行研究:可视化下的全球恐怖主义态势;恐怖袭击事件风险评估模型;恐怖袭击的时空特性。针对恐怖主义态势,采用自然语言、蔓延指数等方法对GTD数据库数据进行挖掘研究。结果显示,恐怖组织比较青睐于采取爆炸类手段使用炸弹发动恐怖袭击,而普通民众缺乏安全意识和自保能力,成为袭击的首选目标;极端宗教主义依旧是当代恐怖主义威胁的主要来源,并且自基地组织灭亡后ISIL成为新的代表性恐怖组织;恐怖袭击的动机主要来源于资源的争夺、宗教和民族差异,党政利益之争等;从恐怖活动的空间蔓延指数来看,2017年度恐怖袭击事件有往南美、东亚和大洋洲蔓延趋势,建议该地区的政府部门加强安保工作,采取有效措施将恐怖活动扼杀在摇篮中。提出基于PCA与K-means聚类分析的恐袭量化风险评估模型,对恐怖袭击事件进行风险等级评估。采用相关分析和卡方检验构建了20个风险评价指标,通过求解...
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
研究思路框架
让数据产生更大的价值。方面来说,数据挖掘偏重于技术的实现,对业务知识的熟练度量的数据中发现未知的模式和规律,是数据挖掘的目的所在,项目的落地。握技能方面来说,数据挖掘对数学功底和编程能力有较高的要机器学习、人工智能等方面的基础,没有好的数学功底,在数程能力是从数据中发现未知模式和规律途径,没有好的编程技。出的结果来说,数据挖掘更多的是模型的和规则的输出,通过的数据进行预测,如个人贷款违约预测模型(预测模型)、判是否存货(分类算法);通过模型或者规则实现商业决策,如荐算法)、划分保险投资者的族群(聚类算法)。与数据分析最常用的挖掘工具有 R 语言、Python、Weka、S中具体的挖掘流程为。
种无监督的学习方法,为了捕获指标数据的原始结构划分为几个有意义的群组、类别,也可称之为族。这间的变异程度最大化,而使得组内变异程度最小化。的结构,还可以用来对数据进行预处理,为进一步的。本文主要运用划分法中的 k-means 聚类。算法无监督学习方法,还是一种使用最广泛的最基础的聚量指标,从而发现数据集中的个类,当两个对象的距类法运算量小,小到中大规模样本数据都可以用此种先指定聚类的数目 k。为:随机选择 k 个样本点,每个样本点初始地代表一本点,依据到族中心的距离,将被划分到最近的类中。不断循环上述过程,当样本均不能够再分配则停止见图 2.1。
本文编号:3070784
【文章来源】:广西师范大学广西壮族自治区
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
研究思路框架
让数据产生更大的价值。方面来说,数据挖掘偏重于技术的实现,对业务知识的熟练度量的数据中发现未知的模式和规律,是数据挖掘的目的所在,项目的落地。握技能方面来说,数据挖掘对数学功底和编程能力有较高的要机器学习、人工智能等方面的基础,没有好的数学功底,在数程能力是从数据中发现未知模式和规律途径,没有好的编程技。出的结果来说,数据挖掘更多的是模型的和规则的输出,通过的数据进行预测,如个人贷款违约预测模型(预测模型)、判是否存货(分类算法);通过模型或者规则实现商业决策,如荐算法)、划分保险投资者的族群(聚类算法)。与数据分析最常用的挖掘工具有 R 语言、Python、Weka、S中具体的挖掘流程为。
种无监督的学习方法,为了捕获指标数据的原始结构划分为几个有意义的群组、类别,也可称之为族。这间的变异程度最大化,而使得组内变异程度最小化。的结构,还可以用来对数据进行预处理,为进一步的。本文主要运用划分法中的 k-means 聚类。算法无监督学习方法,还是一种使用最广泛的最基础的聚量指标,从而发现数据集中的个类,当两个对象的距类法运算量小,小到中大规模样本数据都可以用此种先指定聚类的数目 k。为:随机选择 k 个样本点,每个样本点初始地代表一本点,依据到族中心的距离,将被划分到最近的类中。不断循环上述过程,当样本均不能够再分配则停止见图 2.1。
本文编号:3070784
本文链接:https://www.wllwen.com/shekelunwen/waijiao/3070784.html