基于迁移学习的恐怖行为预测算法研究
发布时间:2017-04-29 05:01
本文关键词:基于迁移学习的恐怖行为预测算法研究,由笔耕文化传播整理发布。
【摘要】:依托文化建模的发展,组织的背景知识信息开始用于预测恐怖行为。目前对于基于背景知识的恐怖行为预测大多选择样本量较为丰富的组织作为预测的对象。然而随着恐怖主义全球化,许多新产生的组织日益涌现,这类组织由于产生时间短且背景知识采集时间粒度大导致缺乏可用的样本。对于这种情况,是难以对恐怖行为进行有效建模的,这便使得已有的方法对于恐怖行为的预测存在预测困难或预测精度低的问题。因此,本文针对恐怖组织背景数据集的特性进行了分析和研究。1)提出了基于多源实例迁移的恐怖行为预测方法,解决了由于新组织缺乏可用样本对预测的影响;2)针对在多源实例迁移预测中源组织筛选失效导致预测效果降低的问题,提出了基于背景属性划分和聚类源组织筛选算法来改进恐怖行为预测效果。论文主要内容如下:(1)提出了基于多源实例迁移的恐怖行为预测算法(Multi-Organization Transfer Ada Boost,MO-TrAdaBoost)。该算法利用迁移学习方法可有效解决新领域学习的特性,通过在训练中使用源组织样本辅助目标组织训练并迭代地修正误分样本权重,从而克服缺乏样本导致预测困难的问题。此外,针对迁移中多源易退化成单源导致预测波动的问题,引入过滤机制和源组织权重因子优化知识迁移过程,在无法确定最优源的情况下使多数源组织都能参与知识迁移,并降低了迁移预测历史表现差的源组织对预测的影响。在恐怖组织背景数据集(Minorities at Risk Organization Behavior,MAROB)上的实验表明,在缺乏可用样本的情况下MO-TrAdaBoost算法与CONVEX算法、SVM算法相比,准确率和查全率分别提升13.2%和7.8%以上,并且MO-TrAdaBoost算法能很好地应对新产生组织的行为预测问题。(2)提出了一种基于背景属性划分和聚类的源组织筛选算法来改进行为预测效果。该算法利用信息熵反映变量不确定性的特点对背景属性划分,提取其中的常态属性(属性值不易发生变化)来反映组织的固有特性;针对源组织筛选失效的问题,考虑从组织固有特性角度挖掘组织间的关联性,以K-modes算法将与目标组织性质相近源组织聚为一类,从而在目标组织样本稀少的情况下对源组织实现有效筛选。由于仅有筛选后的源组织参与迭代训练,降低了预测的时间开销。此外,在迁移预测中仅在非常态属性(属性值不确定,易变化)上进行训练,避免了迁移中组织间常态属性差异对预测的影响。在MAROB上的实验表明改进后的预测算法(Improved Multi-Organization Transfer AdaBoost,IMO-TrAdaBoost)相较MS-TrAdaBoost算法在准确率和查全率上分别提高1.3%和1.9%,并在时间开销上降低了70.6%。(3)为验证上述算法实际应用的可行性,采用面向对象的程序设计思想,在Eclipse开发环境下使用Java开发语言设计并实现了基于迁移学习的恐怖行为预测原型系统。
【关键词】:恐怖行为预测 背景知识 迁移学习 支持向量机 MAROB
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP181
【目录】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 绪论10-16
- 1.1 研究背景和意义10-11
- 1.2 研究现状11-13
- 1.3 主要研究内容13-14
- 1.4 论文的组织结构14-15
- 1.5 本章小结15-16
- 第二章 相关理论及技术16-24
- 2.1 迁移学习基础概念16-17
- 2.2 迁移学习的分类17-19
- 2.3 基于实例的迁移学习19-21
- 2.4 基于特征的迁移学习21-22
- 2.4.1 基于特征选择的方法21
- 2.4.2 基于特征映射的方法21-22
- 2.5 基于参数及相关知识的迁移学习22-23
- 2.6 本章小结23-24
- 第三章 基于多源实例迁移的恐怖行为预测算法24-35
- 3.1 新组织行为预测问题分析24-25
- 3.2 迁移过程优化25-27
- 3.2.1 误差过滤机制25-26
- 3.2.2 基于源组织权重因子的模型集成26-27
- 3.3 基于多组织实例迁移的恐怖行为预测算法27-30
- 3.3.1 实例迁移自适应提升原理27-28
- 3.3.2 MO-TrAdaBoost算法28-29
- 3.3.3 算法分析29-30
- 3.4 实验分析30-34
- 3.4.1 数据集和相关算法30-31
- 3.4.2 算法评价标准31-32
- 3.4.3 实验结果及分析32-34
- 3.5 本章小结34-35
- 第四章 源组织筛选及恐怖行为预测35-47
- 4.1 源组织筛选问题分析35-36
- 4.2 背景属性划分36-38
- 4.3 基于聚类的源组织筛选算法38-41
- 4.3.1 K-modes算法原理38-39
- 4.3.2 距离测度的选择39-40
- 4.3.3 算法描述与分析40-41
- 4.4 基于源组织筛选改进的恐怖行为预测算法41-42
- 4.5 实验分析42-46
- 4.5.1 数据集和相关算法介绍42-43
- 4.5.2 实验结果及分析43-46
- 4.6 本章小结46-47
- 第五章 原型系统的设计与实现47-59
- 5.1 原型系统运行环境及开发平台47
- 5.2 系统设计原则47-48
- 5.3 系统功能模块设计48-51
- 5.3.1 数据预处理模块50
- 5.3.2 源组织筛选模块50
- 5.3.3 迁移训练模块50
- 5.3.4 行为预测模块50-51
- 5.4 系统核心类的设计51-54
- 5.4.1 数据预处理类51-52
- 5.4.2 源组织筛选类52-53
- 5.4.3 实例迁移类53-54
- 5.5 原型系统的实现54-58
- 5.6 本章小结58-59
- 第六章 总结和展望59-61
- 6.1 总结59-60
- 6.2 展望60-61
- 致谢61-62
- 参考文献62-66
- 攻读硕士学位期间发表的学术成果66
【相似文献】
中国硕士学位论文全文数据库 前1条
1 陈泉浈;基于迁移学习的恐怖行为预测算法研究[D];江苏大学;2016年
本文关键词:基于迁移学习的恐怖行为预测算法研究,,由笔耕文化传播整理发布。
本文编号:334204
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/334204.html