军事信息资源数据态势分析
发布时间:2021-11-09 11:26
随着大数据时代的到来,数据在社会生活中发挥着越来越重要的作用。当前信息系统不断普及,而其中的数据建设作为一项重要的系统工程,在建设过程中遇到了很多新的问题,譬如数据资源分散建设、高价值信息缺乏、数据标准不一等。军队的数据建设也正面临着这些挑战,与此同时还存在数据利用效率低下等问题。如何从大量历史军事信息数据中挖掘出部队人员、装备等知识,从而帮助部队解决问题并为领导者提供辅助决策,是一项有着重大意义的工作。近年来计算机技术的快速发展,以聚类分析为代表的数据挖掘技术已经成为当前极为活跃的研究方向,许多的新理论和新算法不断被提出。其中空间数据挖掘中的数据场理论与聚类算法的结合,取得了良好的聚类效果,有着广阔的应用前景。此外由于数据集在嵌入空间后的形状不规范,所以能够对不规则形状类簇进行划分的密度聚类算法的适用范围更加广泛。因此,本文针对在参与军队数据工程建设中遇到的实际问题,同时结合学习的以聚类分析为主的数据挖掘方法,主要进行了以下几个方面的研究内容:(1)提出了宏观数据场和数据态势理论。主要对两者的基本概念和内容进行阐述,明确宏观数据场的概念模型和应用领域,确定数据态势的主要内容和研究方法...
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
二维空间的算法
为了进一步测试算法过程,以图 3.2 中的数据测试为例。如同 3.2 A 所表示,所使用的数据点是非球状的概率分布,同时具有明显的峰值重叠现象。极大值相差近一个数量级的概率值。在图 3.2 B 和 3.2 C 中,分别是 4000 0 个来自 A 中的数据点的分布。在相对应的决策图中(图 3.2 D 和 3.2 E)中只发现 5 个同时具有较大 值和相当大的密度值的数据点。这些点在决策图大的实心球表示并作为对应的聚类中心。选择了聚类中心之后,每一个数会被分配到一个簇类或者一个空洞中。算法能够捕获概率峰的位置和形状于那些对应于不同密度的概率峰(图 3.2 C 中的蓝色和淡绿色的数据点)以状的峰。进一步来讲,如同图 3.2 A,分配到对应的概率分布的视觉检测区洞的数据点不会分配到任何概率峰。D E F图 3.2 合成数据点分布结果。A:数据点的概率分布,最低亮度的区域对应于相同的分布概率 20%。B and C:分别为4000 和 1000 个数据点例子的分布,根据数据点所属簇类的不同着色。黑色点属于空洞。D and E:对应的决策图,聚类中心分别着色。F:把分配到错误簇类的数据点所占比例与样本尺寸的关系。误差棒表示平均标准误差。
基于数据场的改进快速查找峰值密度聚类算法具体流程描述如下:输入:数据集1 2D (X , X , )n …,X ,中断势值c 。输出:聚类结果(1) 将数据集 D 嵌入到二维空间,利用最小化势熵方法确定 的取值。(2) 根据公式221 1(x)ix xn nii ip e 计算各数据点的势值。(3) 根据公式 ( )i ij cj 计算各数据点的局部密度值,并且计算各数据点的 值。(4) 选择具有局部或者全局极大值密度值和 去极大值的数据点作为聚类中心。(5) 把剩余的数据点分配到与其 值较为接近的最近的聚类中心所在的簇类,输出聚类结果。从图 2A 中选择 10000 个数据点作为数据集,分别用快速查找峰值密度聚类算和改进后的快速查找峰值密度聚类算法对其进行聚类,得到的结果如图所示:
【参考文献】:
期刊论文
[1]联合作战战场态势一致性评估[J]. 曾清,施慧杰,杜阳华. 指挥控制与仿真. 2014(01)
[2]一种基于数据场的复杂网络聚类算法[J]. 刘玉华,张翼,徐翠,晋建志. 计算机科学. 2013(11)
[3]基于Markov链的部队人员管理风险评估模型研究[J]. 常作勇,张磊,马伟标. 武警学院学报. 2013(09)
[4]战场态势及态势估计的新见解[J]. 李赟,刘钢,老松杨. 火力与指挥控制. 2012(09)
[5]中国地域多功能性评价及其决策机制[J]. 刘彦随,刘玉,陈玉福. 地理学报. 2011(10)
[6]基于数据场的概率神经网络算法[J]. 李春芳,刘连忠,陆震. 电子学报. 2011(08)
[7]战场态势估计概念、结构与效能[J]. 赵宗贵,李君灵,王珂. 中国电子科学研究院学报. 2010(03)
[8]邻域平衡密度聚类算法[J]. 武佳薇,李雄飞,孙涛,李巍. 计算机研究与发展. 2010(06)
[9]基于数据场的大规模本体映射[J]. 仲茜,李涓子,唐杰,周立柱. 计算机学报. 2010(06)
[10]利用数据场的表情脸识别方法[J]. 王树良,邹珊珊,操保华,谢媛. 武汉大学学报(信息科学版). 2010(06)
博士论文
[1]信息融合中的态势评估技术研究[D]. 王晓帆.西安电子科技大学 2012
[2]态势估计中的关键技术研究[D]. 柴慧敏.西安电子科技大学 2009
[3]聚类分析中若干关键技术的研究[D]. 杨小兵.浙江大学 2005
硕士论文
[1]基于C/S模式的某部队人力资源管理系统的设计与实现[D]. 黄炜.厦门大学 2014
[2]基于数据场的密度聚类算法研究[D]. 杨静.山西大学 2013
本文编号:3485242
【文章来源】:国防科技大学湖南省 211工程院校 985工程院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
二维空间的算法
为了进一步测试算法过程,以图 3.2 中的数据测试为例。如同 3.2 A 所表示,所使用的数据点是非球状的概率分布,同时具有明显的峰值重叠现象。极大值相差近一个数量级的概率值。在图 3.2 B 和 3.2 C 中,分别是 4000 0 个来自 A 中的数据点的分布。在相对应的决策图中(图 3.2 D 和 3.2 E)中只发现 5 个同时具有较大 值和相当大的密度值的数据点。这些点在决策图大的实心球表示并作为对应的聚类中心。选择了聚类中心之后,每一个数会被分配到一个簇类或者一个空洞中。算法能够捕获概率峰的位置和形状于那些对应于不同密度的概率峰(图 3.2 C 中的蓝色和淡绿色的数据点)以状的峰。进一步来讲,如同图 3.2 A,分配到对应的概率分布的视觉检测区洞的数据点不会分配到任何概率峰。D E F图 3.2 合成数据点分布结果。A:数据点的概率分布,最低亮度的区域对应于相同的分布概率 20%。B and C:分别为4000 和 1000 个数据点例子的分布,根据数据点所属簇类的不同着色。黑色点属于空洞。D and E:对应的决策图,聚类中心分别着色。F:把分配到错误簇类的数据点所占比例与样本尺寸的关系。误差棒表示平均标准误差。
基于数据场的改进快速查找峰值密度聚类算法具体流程描述如下:输入:数据集1 2D (X , X , )n …,X ,中断势值c 。输出:聚类结果(1) 将数据集 D 嵌入到二维空间,利用最小化势熵方法确定 的取值。(2) 根据公式221 1(x)ix xn nii ip e 计算各数据点的势值。(3) 根据公式 ( )i ij cj 计算各数据点的局部密度值,并且计算各数据点的 值。(4) 选择具有局部或者全局极大值密度值和 去极大值的数据点作为聚类中心。(5) 把剩余的数据点分配到与其 值较为接近的最近的聚类中心所在的簇类,输出聚类结果。从图 2A 中选择 10000 个数据点作为数据集,分别用快速查找峰值密度聚类算和改进后的快速查找峰值密度聚类算法对其进行聚类,得到的结果如图所示:
【参考文献】:
期刊论文
[1]联合作战战场态势一致性评估[J]. 曾清,施慧杰,杜阳华. 指挥控制与仿真. 2014(01)
[2]一种基于数据场的复杂网络聚类算法[J]. 刘玉华,张翼,徐翠,晋建志. 计算机科学. 2013(11)
[3]基于Markov链的部队人员管理风险评估模型研究[J]. 常作勇,张磊,马伟标. 武警学院学报. 2013(09)
[4]战场态势及态势估计的新见解[J]. 李赟,刘钢,老松杨. 火力与指挥控制. 2012(09)
[5]中国地域多功能性评价及其决策机制[J]. 刘彦随,刘玉,陈玉福. 地理学报. 2011(10)
[6]基于数据场的概率神经网络算法[J]. 李春芳,刘连忠,陆震. 电子学报. 2011(08)
[7]战场态势估计概念、结构与效能[J]. 赵宗贵,李君灵,王珂. 中国电子科学研究院学报. 2010(03)
[8]邻域平衡密度聚类算法[J]. 武佳薇,李雄飞,孙涛,李巍. 计算机研究与发展. 2010(06)
[9]基于数据场的大规模本体映射[J]. 仲茜,李涓子,唐杰,周立柱. 计算机学报. 2010(06)
[10]利用数据场的表情脸识别方法[J]. 王树良,邹珊珊,操保华,谢媛. 武汉大学学报(信息科学版). 2010(06)
博士论文
[1]信息融合中的态势评估技术研究[D]. 王晓帆.西安电子科技大学 2012
[2]态势估计中的关键技术研究[D]. 柴慧敏.西安电子科技大学 2009
[3]聚类分析中若干关键技术的研究[D]. 杨小兵.浙江大学 2005
硕士论文
[1]基于C/S模式的某部队人力资源管理系统的设计与实现[D]. 黄炜.厦门大学 2014
[2]基于数据场的密度聚类算法研究[D]. 杨静.山西大学 2013
本文编号:3485242
本文链接:https://www.wllwen.com/shekelunwen/renwuzj/3485242.html