特征选择方法及其在红斑鳞状皮肤病诊断中的应用研究
本文选题:特征选择 切入点:F-score 出处:《陕西师范大学》2010年硕士论文 论文类型:学位论文
【摘要】: 特征选择作为一种数据预处理的重要方法,是监督学习算法中的一个重要组成部分,在数据挖掘、机器学习,模式识别等相关领域的研究和应用中有重要地位。近年来,图像处理、文本识别、基因表达等大规模问题的不断出现,特征选择算法越来越受到人们的重视,并对其提出了严峻的挑战,寻找能够适应大规模数据的准确性和运行效率等综合性能较好的特征选择方法成为一种迫切的需要。本文对高维数据的特征选择算法作了一些研究,提出了一种适用于多类别模式识别问题特征选择的特征重要性度量策略,并将所提出的特征选择算法应用到红斑鳞状皮肤病诊断中研究中。本文的主要工作包括以下几个部分。 首先,对目前特征选择的研究现状和问题进行了具体而又深入的研究,分析了特征选择的定义,特征选择算法与特征提取的关系,特征选择的四个方面,特征选择的两种模式,归纳了几种常见的搜索算法,并提出了特征选择算法的选用技巧。 其次,提出了一种改进的F-score特征选择方法。传统的F-score特征选择方法是度量样本特征在两类之间的辨别能力的方法,本文对其进行推广,提出了改进的F-score,使其不但能够评价样本特征在两类之间的辨别能力,而且能够度量样本特征在多类之间的辨别能力大小。另外,结合Filter和Wrapper各自的优缺点,提出了基于IFSFS (Improved F-score and Sequential Forward Search(顺序前进法))与SVM (Support Vector Machines,支持向量机)的特征选择方法。它以改进的F-score作为特征选择准则,顺序前进法(SFS)作为特征选择的搜索方法,用支持向量机作为分类方法来评估特征子集的有效性,实现有效的特征选择,并将该方法应用到红斑鳞状皮肤病的诊断中。通过实验结果证明该特征选择方法的有效性。 最后,针对SFS的主要缺点,即一旦某个特征已入选,即使由于后加入的特征使它变为多余,也无法再把它剔除,本文提出了基于IFSFFS(Improved F-score and Sequential Forward Floating Search(顺序前进浮动搜索))与SVM相结合的特征选择方法。将IFSFFS+SVM特征选择方法应用到红斑鳞状皮肤病诊断中进行实验测试发现,该方法取得了非常好的诊断效果。
[Abstract]:As an important method of data preprocessing, feature selection is an important part of supervised learning algorithm, and plays an important role in the research and application of data mining, machine learning, pattern recognition and so on. With the emergence of large scale problems such as image processing, text recognition, gene expression and so on, feature selection algorithms have been paid more and more attention to, and put forward a severe challenge to them. It is an urgent need to find feature selection methods that can adapt to the accuracy and efficiency of large scale data. In this paper, we do some research on the feature selection algorithm for high dimensional data. In this paper, a feature importance measurement strategy for multi-class pattern recognition problem is proposed, and the proposed feature selection algorithm is applied to the diagnosis of erythema squamous dermatosis. The main work of this paper includes the following parts. First of all, the current research status and problems of feature selection are studied in detail, and the definition of feature selection, the relationship between feature selection algorithm and feature extraction, the four aspects of feature selection are analyzed. Two patterns of feature selection, several common search algorithms are summarized, and the selection skills of feature selection algorithms are proposed. Secondly, an improved F-score feature selection method is proposed. In this paper, an improved F-score-based algorithm is proposed, which can not only evaluate the discriminative ability of sample features between two classes, but also measure the discriminative ability of sample features between different classes. In addition, combining the advantages and disadvantages of Filter and Wrapper, the improved F-score. A new feature selection method based on IFSFS improved F-score and Sequential Forward search and SVM support Vector machines is proposed. The improved F-score is used as the feature selection criterion, and the sequential forward method is used as the search method for feature selection. Support vector machine (SVM) is used as classification method to evaluate the effectiveness of feature subset and to realize effective feature selection. The method is applied to the diagnosis of erythema squamous dermatosis. The experimental results show that the feature selection method is effective. Finally, the main drawback of SFS is that once a feature has been selected, it can no longer be eliminated, even if it becomes redundant because of the added feature. In this paper, a feature selection method based on IFSFFS(Improved F-score and Sequential Forward Floating search and SVM is proposed. The IFSFFS SVM feature selection method is applied to the diagnosis of erythema squamous skin disease. This method has achieved a very good diagnostic effect.
【学位授予单位】:陕西师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:R758.6;TP181
【相似文献】
相关期刊论文 前10条
1 许朝霞;王忆勤;颜建军;郭睿;刘国萍;燕海霞;李福凤;徐t;郝一鸣;钱鹏;;基于支持向量机和人工神经网络的心血管疾病中医证候分类识别研究[J];北京中医药大学学报;2011年08期
2 董书琴;谢宏;;基于CSP与SVM算法的警觉度脑电信号分类[J];微型机与应用;2011年16期
3 刘伟;王建平;张崇巍;;基于SVM的生物电阻抗人体内脏脂肪测量研究[J];电子测量与仪器学报;2011年07期
4 李淑贤;陈超;王淑美;邓小慧;梁生旺;;支持向量机回归算法用于筛选脑得生抗血栓有效部位[J];中药材;2011年07期
5 周酥;朱蒂;吴效明;黄岳山;;基于小波变换的心音包络提取算法及应用[J];中国组织工程研究与临床康复;2011年30期
6 李立奇;张瑗;周跃;王开发;;基于氨基酸对含纤连蛋白域蛋白质亚细胞的定位预测(英文)[J];中国组织工程研究与临床康复;2011年21期
7 赖丽娟;王志刚;吴效明;熊冬生;;基于支持向量机的ICU中急性低血压预测模型研究[J];生物医学工程学杂志;2011年03期
8 黄志华;李明泓;马原野;周昌乐;;事件诱发电位信号分类的时空特征提取方法[J];生物化学与生物物理进展;2011年09期
9 李蓉;孙媛;;机器学习技术在胸癌诊断中的应用[J];科学技术与工程;2011年20期
10 孟秋池;邵伟;葛成伟;程浩;丁建东;;基于临床与基因图谱的结肠癌基因标签提取[J];数学的实践与认识;2011年14期
相关会议论文 前10条
1 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
2 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
3 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
4 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
5 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
6 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
7 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
8 张军;;支持向量机方法在地下水位干扰排除中的初步应用[A];2007年地震流体学术研讨会论文摘要集[C];2007年
9 许建生;盛立东;;基于改进的支持向量机和BP神经网络的识别算法[A];第八届全国汉字识别学术会议论文集[C];2002年
10 荣海娜;张葛祥;张翠芳;;基于支持向量机的非线性系统辨识方法[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
相关重要报纸文章 前10条
1 课题主持人 李心丹 课题协调人 上海证券交易所 施东晖 傅浩 课题研究员 宋素荣 查晓磊 宾红辉 张许宏 郭静静 黄隽 南京大学工程管理学院;内幕交易与市场操纵的行为动机与判别监管研究[N];中国证券报;2007年
2 李水根;计算机详解配伍与药效关系[N];健康报;2005年
3 清华大学 苏光大;非接触式人脸识别技术[N];计算机世界;2006年
4 YMG记者 李仁 通讯员 曲华明 孙运智;我市九项目进入省“盘子”[N];烟台日报;2010年
5 上海大学理学院教授、副院长 陆文聪;酷爱化学 孜孜以求[N];中国化工报;2006年
6 ;选择合适的数据挖掘算法[N];计算机世界;2007年
7 周颖;王米渠与中医心理学[N];中国中医药报;2006年
8 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
9 记者 张云普邋通讯员 全攀峰 安强强;大庆物探深度域地震资料岩性解释技术获得五大突破[N];中国石油报;2008年
10 本报记者 冯治恩;敢与“雷公”试比高[N];铜川日报;2008年
相关博士学位论文 前10条
1 于哲夫;一种新的特征选择方法及其在路面使用性能分析中的应用[D];大连海事大学;2011年
2 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
3 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
4 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
5 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
6 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
7 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
8 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
9 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
10 任东;基于支持向量机的植物病害识别研究[D];吉林大学;2007年
相关硕士学位论文 前10条
1 张宝华;支持向量机在入侵检测系统中的研究和应用[D];天津理工大学;2010年
2 江锋;支持向量机在分类及人脸检测应用中的研究[D];南京理工大学;2003年
3 傅正钢;基于统计学习的人工智能在数字游戏和数字娱乐上的应用[D];浙江大学;2004年
4 朱晓芳;基于支持向量机的田间杂草识别方法研究[D];江苏大学;2010年
5 朱明玲;基于改进的小波变换和支持向量机的纺织细纱机故障自动诊断[D];东华大学;2011年
6 赖永标;支持向量机在地下工程中的应用研究[D];山东科技大学;2004年
7 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
8 沈徐辉;基于核主成分与支持向量机的体内药物代谢预测[D];浙江大学;2011年
9 李铮;基于支持向量机的道路交通标志识别的研究[D];燕山大学;2011年
10 王启超;基于组合核函数支持向量机的软测量技术及其应用研究[D];江西理工大学;2011年
,本文编号:1570276
本文链接:https://www.wllwen.com/yixuelunwen/pifb/1570276.html