基于全方位优化算法的马田分类和排序评价方法研究及应用
本文关键词:基于全方位优化算法的马田分类和排序评价方法研究及应用,,由笔耕文化传播整理发布。
【摘要】:数据挖掘是从数据中获取知识和信息,并进行决策的有效手段。分类是数据挖掘的重要任务,它根据样本的数据特征判定其所属类别。目前许多成熟有效且各具特点的分类方法得到了深入研究和广泛应用,但仍有各自的局限性和不足。在分类过程中,特征变量筛选通常能够起到简化问题、提高分类精度和效率的作用。 马田系统(Mahalanobis-Taguchi System, MTS)是一种结合马氏距离、正交表和信噪比进行分类和诊断的新型模式识别方法。MTS具有的能够筛选重要特征变量、对数据分布不需要进行假设、分类速度快等优点使得它在工业生产、企业管理和模式识别等领域得到了广泛的应用。作为一种较新的分类方法,它在理论基础和方法使用上存在一些缺陷和严谨性问题,如:特征变量筛选方法有待改进、阈值确定主观性较强、局限于二类分类等。除了用于分类和诊断之外,MTS的特点使得它还可以用于排序(综合)评价。本文针对MTS的不足,以MTS改进为主线,以优化方法为主要手段,目标是发展MTS使其成为一种实用有效的分类和排序评价方法,并应用于现实问题。本文的研究工作有以下几个方面: (1)基于全方位优化算法的MTS二类分类方法研究 针对传统MTS在分类过程中采用正交表和信噪比筛选特征变量以及采用损失函数法确定阈值存在的缺陷,使用多目标优化和全方位优化算法替代以进行改进。综合考虑分类精度、望大特性信噪比和降维程度等目标构建了多目标优化模型并用全方位优化算法求解以筛选特征变量和确定阈值;采用数据集实验和比较的方式对方法的有效性进行了验证和讨论;将方法用于产品质量检测的现实问题。研究结果表明,该方法不仅有很高的分类精度,还能有效的筛选特征变量,对传统MTS有了较大改进。 (2)基于全方位优化算法和概率阈值模型的MTS不平衡数据分类方法研究 类别不平衡是分类问题常常面临的挑战。MTS通过马氏距离构建一个连续测量尺度而非直接对训练样本进行学习的性质有望不受类别不平衡的影响,而阈值的合理确定对该问题更加重要。提出了一种概率阈值模型用于MTS不平衡数据分类阈值的确定;综合考虑不平衡数据分类性能评估指标的g/F值、望大型信噪比和降维程度等目标构建多目标优化模型并用全方位优化算法求解以筛选特征变量;采用数据集实验和比较的方式对方法的有效性进行检验和讨论。研究结果表明,该方法对不平衡数据有良好的分类能力,同时还能筛选重要特征变量。 (3)MTS多类分类方法研究 MTS是一种二类分类方法,不能直接用于多类分类。本文研究了两种MTS多类分类方法——二叉树MTS和多马氏空间特征变量筛选MTS。二叉树MTS通过二叉树与MTS的结合,将多类分类问题进行分解。研究了二叉树MTS的实施过程和步骤,以及二叉树的构建方案等。多马氏空间特征变量筛选MTS通过为每类构建马氏空间,运用距离判别思想构建分类器,同时优化特征空间。研究了多马氏空间特征变量筛选MTS的实施过程和步骤,综合考虑分类精度、改进的望大型信噪和降维程度等目标构建多目标优化模型并用全方位优化算法求解以筛选特征变量。采用数据集实验和比较的方式对两种方法的有效性进行了检验和讨论。最后将MTS多类分类方法应用于政府投融资平台企业的信用等级评价。研究结果表明,多马氏空间特征变量筛选MTS有着更高的分类精度和特征变量筛选效果,具有更高的应用价值。 (4)MTS排序评价方法研究 MTS目前主要用于分类问题。实际上,MTS可计算出样本相对于基准空间(马氏空间)的马氏距离,得出样本偏离的程度,从而对待测样本进行排序。本文研究MTS排序评价方法,具体包括:MTS排序评价方法的过程及步骤;基于全方位优化算法的评价指标筛选模型;采用算例和比较的方式对MTS排序评价的有效性进行分析和讨论。研究结果表明,MTS排序评价方法不需要确定指标权重,能够保持评价基准的一致,且能够筛选指标,是一种有效的评价方法,但基准空间的确定机制需要进一步研究和完善。 综合以上研究工作,本文的主要贡献和创新点有: (1)识别不同的分类或排序评价目标,在MTS特征变量筛选这一核心问题中导入优化思想,创新性的提出和研究了特征变量筛选的多目标优化模型以替代传统MTS的正交表,并采用先进的全方位优化算法求解,是一种新的特征变量筛选方法。 (2)根据不同的分类目的,采用优化或概率模型替代传统MTS的损失函数(或穷举法)来确定MTS进行分类时需要的阈值,这是MTS新的闽值确定办法。 (3)通过概率闽值模型、二叉树和多马氏空间等手段,将MTS二类分类方法成功的扩展到了不平衡数据分类和多类分类,并验证了这些方法的有效性,是新的不平衡数据分类方法和多类分类方法。
【关键词】:分类 马田系统 多目标优化 全方位优化算法 不平衡数据 多类分类 特征变量筛选 排序评价
【学位授予单位】:南京理工大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:C934;C931.1
【目录】:
- 摘要5-7
- Abstract7-13
- 1 绪论13-24
- 1.1 研究背景及意义13-15
- 1.2 MTS国内外研究现状及评述15-18
- 1.2.1 国外研究现状15-16
- 1.2.2 国内研究现状16-18
- 1.2.3 已有贡献和研究不足18
- 1.3 本文的主要工作、解决的科学问题和拟创新点18-21
- 1.3.1 本文的主要工作18-20
- 1.3.2 本文解决的关键科学问题20-21
- 1.3.3 本文的拟创新点21
- 1.4 本文的研究方法和技术路线21-23
- 1.5 论文的章节结构安排23-24
- 2 相关理论及方法概述24-48
- 2.1 分类问题24-30
- 2.1.1 分类问题描述24-25
- 2.1.2 分类问题常用方法25-30
- 2.2 MTS30-40
- 2.2.1 马氏距离31-33
- 2.2.2 正交表33
- 2.2.3 信噪比33-35
- 2.2.4 确定异常样本的方向35
- 2.2.5 MTS阈值确定方法35-37
- 2.2.6 MTS的实施步骤37-38
- 2.2.7 MTS的其他相关问题38-40
- 2.2.8 MTS的特点40
- 2.3 多目标优化40-43
- 2.4 基于全局准则法的全方位优化算法43-47
- 2.4.1 全局准则法43
- 2.4.2 全方位优化算法43-44
- 2.4.3 全方位优化算法的步骤和伪代44-46
- 2.4.4 若干算子介绍46-47
- 2.5 本章小结47-48
- 3 基于全方位优化算法的MTS二类分类方法研究48-79
- 3.1 传统MTS分类方法50-56
- 3.1.1 传统MTS分类方法的实施过程和步骤50-52
- 3.1.2 传统MTS分类方法实验52-56
- 3.2 MTSO分类方法的实施过程和步骤56-58
- 3.3 MTSO特征变量筛选和阈值确定的多目标优化模型58-64
- 3.3.1 优化目标59-63
- 3.3.2 多目标优化模型及求解方法63-64
- 3.4 MTSO性能评估的实验分析64-74
- 3.4.1 分类方法性能的评估指标和数据集64-66
- 3.4.2 分类精度的计算结果66-69
- 3.4.3 比较研究69-73
- 3.4.4 结果和讨论73-74
- 3.5 应用研究74-78
- 3.5.1 背景描述74
- 3.5.2 实施74-77
- 3.5.3 效益分析77-78
- 3.6 本章小结78-79
- 4 基于全方位优化算法和概率阈值模型的MTS不平衡数据分类方法研究79-97
- 4.1 概率阈值模型80-82
- 4.2 MTSOP不平衡数据分类方法的实施过程和步骤82-84
- 4.3 MTSOP特征变量筛选的多目标优化模型84-87
- 4.3.1 不平衡数据分类效果评价指标84-85
- 4.3.2 优化目标85-86
- 4.3.3 多目标优化模型及求解方法86-87
- 4.4 MTSOP性能评估的实验分析87-95
- 4.4.1 分类方法性能的评估指标和数据集87-88
- 4.4.2 与常规方法比较88-94
- 4.4.3 与改进的SVM比较94
- 4.4.4 结果和讨论94-95
- 4.5 本章小结95-97
- 5 MTS多类分类方法研究97-118
- 5.1 BT-MTS多类分类方法99-103
- 5.1.1 BT-MTS99-100
- 5.1.2 BT-MTS多类分类方法的实施过程和步骤100-101
- 5.1.3 二叉树结构确定方案101-103
- 5.2 MF-MTS多类分类方法103-109
- 5.2.1 MF-MTS多类分类方法的实施过程和步骤103-106
- 5.2.2 MF-MTS特征变量筛选的多目标优化模型106-109
- 5.3 MTS多类分类方法性能评估的实验分析109-113
- 5.3.1 分类方法性能的评估指标和数据集109
- 5.3.2 比较研究109-112
- 5.3.3 结果和讨论112-113
- 5.4 应用研究113-116
- 5.4.1 背景描述113-114
- 5.4.2 实施114-115
- 5.4.3 分析和讨论115-116
- 5.5 本章小结116-118
- 6 基于全方位优化算法的MTS排序评价方法研究118-131
- 6.1 MTS排序评价方法的实施过程和步骤121-124
- 6.2 MTS排序评价方法评价指标筛选的多目标优化模型124-126
- 6.2.1 优化目标124-126
- 6.2.2 优化模型126
- 6.3 MTS排序评价方法有效性的算例研究126-130
- 6.3.1 实施评价126-127
- 6.3.2 分析与讨论127-130
- 6.4 本章小节130-131
- 7 结论与展望131-135
- 7.1 工作总结131-133
- 7.2 本文的创新点133
- 7.3 研究展望133-135
- 参考文献135-147
- 致谢147-148
- 附录148-149
【相似文献】
中国期刊全文数据库 前10条
1 金振辉;汪善荣;何一民;;浅析我国科技评价的理论、方法和实践[J];云南科技管理;2006年04期
2 李海燕;曹文瑞;吴少林;黄毓文;;我国科技人才评价指标体系和综合评价方法综述[J];中华医学科研管理杂志;2006年06期
3 米旭明;;企业信息系统可拓评价方法研究[J];系统仿真技术;2007年02期
4 岳一凡;;哲学社会科学研究成果评价方法研究[J];当代经济;2009年05期
5 张放;赵春艳;张伟;;品牌竞争力评价方法综述[J];当代经济;2009年17期
6 任晔;肖飒;;现代物流系统综合评价方法研究[J];物流科技;2011年02期
7 肖素梅,殷国富,汪永超,石宇强;企业信息化水平评价指标与评价方法研究[J];计算机集成制造系统-CIMS;2005年08期
8 白景涛;;物流项目的评价方法研究[J];港工技术;2006年04期
9 陈明政;张波;;资源型企业可持续发展定量研究方法综述[J];湖北社会科学;2009年12期
10 侯波;;港口物流竞争力评价方法研究[J];科技信息;2010年17期
中国重要会议论文全文数据库 前10条
1 王京红;董春梅;;微裂缝测井识别与评价方法研究[A];中国地球物理.2003——中国地球物理学会第十九届年会论文集[C];2003年
2 张树奎;鲁子爱;;一种港口安全风险灰色评价方法研究[A];2009年苏浙闽沪航海学术研讨论文集[C];2009年
3 惠兴杰;;企业管理人才价值评价方法研究[A];全国第一届嵌入式技术联合学术会议论文集[C];2006年
4 王传好;曹光群;陈李英;王凤娟;;香波的泡沫特性评价方法研究[A];2002年中国化妆品学术研讨会论文集[C];2002年
5 白跃世;马迅;;体育科技创新指标体系构建和评价方法研究[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
6 陈惠;王加义;张春桂;李丽纯;林晶;张星;;福建省农业生态环境质量评价方法研究[A];第三届全国农业环境科学学术研讨会论文集[C];2009年
7 陈彦清;杨建宇;张晓东;苏伟;黄健熙;苏晓慧;严泰来;;我国县级雪灾风险评价方法研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
8 刘伟;鞠美庭;林慧;石英琳;;生态工业园评价指标体系与评价方法研究[A];中国环境保护优秀论文精选[C];2006年
9 熊子瑜;;中介语声调系统的评价方法研究[A];第九届全国人机语音通讯学术会议论文集[C];2007年
10 康凯;齐莉丽;邢亚东;;供应商评价指标体系及评价方法研究[A];2002年中国管理科学学术会议论文集[C];2002年
中国重要报纸全文数据库 前10条
1 ;关于开展2002年度中国建筑装饰行业百强承包商排序评价活动的解释及说明[N];中华建筑报;2003年
2 ;2002年度中国建筑装饰行业百强承包商排序评价活动实施办法[N];中华建筑报;2003年
3 肖柏 李娟;《城市污染场地评价方法研究》科研课题通过验收[N];中国建设报;2006年
4 记者 宋鹏邋通讯员 董广华;新疆油田未开发储量经济评价方法研究获突破[N];中国石油报;2007年
5 徐亚静;中医药临床疗效评价研究期待突破[N];中国医药报;2007年
6 首席记者 于森;油公司九项科研成果获省科技进步奖[N];盘锦日报;2007年
7 本报记者 刘海凌;3+4演绎会计学术精彩[N];中国财经报;2007年
8 敖娟;北京企业为何报名踊跃?[N];中华建筑报;2003年
9 汤波 冯舒;湖北油气井损害评价项目通过专家鉴定[N];中国石化报;2006年
10 蒲国永 周建君 本报记者 晏燕;从大山深处迈向科技颠峰[N];科技日报;2004年
中国博士学位论文全文数据库 前10条
1 牛俊磊;基于全方位优化算法的马田分类和排序评价方法研究及应用[D];南京理工大学;2012年
2 靳涛;火电机组反向建模方法的研究[D];华北电力大学(北京);2011年
3 陆霄虹;中国当代绘画艺术作品特征价格研究[D];南京航空航天大学;2009年
4 鲁万波;基于特征变量的中国股票市场微观结构数量研究:日内模式、持续时间与价格发现[D];西南财经大学;2009年
5 肖人毅;面向过程的科研项目评价方法研究[D];大连理工大学;2011年
6 单艺斌;妇女社会地位评价方法研究[D];东北财经大学;2000年
7 丛剑波;基于CAPM两因素模型的个股波动率分解的实证分析[D];吉林大学;2009年
8 吴瑞梅;名优绿茶品质感官评价的仪器化表征研究[D];江苏大学;2012年
9 张立辉;我国发电企业竞争力分析与评价方法研究[D];华北电力大学(北京);2006年
10 于光;矿业城市经济转型理论与评价方法研究[D];中国地质大学(北京);2007年
中国硕士学位论文全文数据库 前10条
1 谢园春;农业信息资源配置效益及其评价方法研究[D];吉林大学;2007年
2 徐雪峰;企业业务流程管理能力及其评价方法研究[D];吉林大学;2007年
3 亢永;民用建筑的室内空气品质评价方法研究[D];安徽理工大学;2007年
4 李慧;乡镇长经济责任审计评价方法研究[D];河南大学;2008年
5 乔晶;循环经济产业链经济学稳定性及评价方法研究[D];山东大学;2008年
6 宋艳东;基于模糊数据融合的室内舒适度评价方法研究[D];燕山大学;2010年
7 崔春宇;吉林省医药研发资助项目效果评价研究[D];吉林大学;2005年
8 张宝成;城市基础设施建设评价方法研究[D];天津大学;2005年
9 沈德聪;绿色制造系统的判定和评价方法研究[D];北京工业大学;2006年
10 杨奋;教育信息化评价方法研究[D];哈尔滨工程大学;2007年
本文关键词:基于全方位优化算法的马田分类和排序评价方法研究及应用,由笔耕文化传播整理发布。
本文编号:292172
本文链接:https://www.wllwen.com/guanlilunwen/lindaojc/292172.html