利用基因表达值相对大小秩序标志鉴别肺癌
本文选题:标志 + 分类器 ; 参考:《生物医学工程学杂志》2017年01期
【摘要】:在应用基于转录组特征构建的支持向量机、贝叶斯分类器等传统分类器对组织样本进行分类时,要求对基因表达谱进行样本间的数据标准化处理,以去除实验批次效应带来的影响,因此限制了这些分类器在个体化水平上的应用。本文旨在构建鉴别肺癌组织与非癌(肺炎与肺正常)组织的个体化分类器。文中采用来自多组独立数据的197例肺癌与189例肺非癌组织样本作为训练集,筛选得到了3对基因作为特征,应用多数投票规则区分肺癌组织与肺非癌组织的平均准确率达到95.34%。然后,本文采用来自多组独立数据的251例肺癌组织与141例肺非癌组织样本的非标化数据进行独立验证,其平均准确率达到96.78%。因此,本文提出的该分类器可对由不同实验室检测的样本进行个体化判断提供一种新的思路,具有较强的临床实用性。
[Abstract]:When traditional classifiers such as support vector machine and Bayesian classifier based on transcriptional group feature are used to classify tissue samples, it is required to standardize the data of gene expression profiles among samples. The application of these classifiers at the individualized level is limited by removing the effects of the experimental batch effect. The purpose of this study was to construct an individual classifier for distinguishing lung cancer from non-cancerous (pneumonia and normal lung) tissues. In this paper, 197 samples of lung cancer and 189 samples of non-cancerous lung tissue from multiple independent data were used as training set, and 3 pairs of genes were selected as characteristics. The average accuracy of majority voting rule in distinguishing lung cancer tissue from non-cancerous lung tissue was 95.3434. Then, the nonstandard data from 251 lung cancer tissues and 141 noncancerous lung tissue samples from multiple groups of independent data were used for independent verification. The average accuracy was 96.78%. Therefore, the classifier presented in this paper can provide a new idea for individualized judgment of samples detected by different laboratories, and it has strong clinical practicability.
【作者单位】: 福建医科大学基础医学院生物信息学系消化道恶性肿瘤教育部重点实验室;
【基金】:国家自然科学基金(81572935,81372213,81501215,81501829) 大学生创新创业训练计划(201510392017) 福建医科大学苗圃科研基金(2015MP005)
【分类号】:R734.2
【相似文献】
相关期刊论文 前10条
1 姜萱;;利用数据挖掘技术构造医学图像分类器的研究[J];时珍国医国药;2008年08期
2 谢华;夏顺仁;张赞超;;医学图像识别中多分类器融合方法的研究进展[J];国际生物医学工程杂志;2006年03期
3 韦艳艳;李陶深;张超群;;集成分类器组合算法及其在医学诊断中的应用[J];广西大学学报(自然科学版);2013年05期
4 谢华,夏顺仁,高光金;基于分类器融合的骨髓细胞识别研究[J];计算机工程与应用;2005年27期
5 崔克彬,李战怀,张阳;DRC-BK分类器的规则筛选算法[J];医学信息;2004年09期
6 谢文娟,曾立波,王思贤,吴琼水,张燕;骨髓细胞多光谱显微图像分类器的设计[J];计算机工程与应用;2005年02期
7 曹美玲;张新峰;沈兰荪;;分类器融合技术在中医舌象老嫩识别中的应用研究[J];北京生物医学工程;2006年06期
8 涂有强;陈香;张旭;赵章琰;杨基海;;一种适用于手势动作sEMG信号识别的改进型模糊推理分类器[J];北京生物医学工程;2008年04期
9 孙利;徐伟栋;厉力华;刘伟;彭芳青;张娟;;基于双视角和多分类器信息融合的乳腺钼靶图像肿块分类研究[J];中国生物医学工程学报;2011年01期
10 郑斌;厉力华;;基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测[J];中国生物医学工程学报;2013年05期
相关会议论文 前10条
1 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
2 翟静;李海宏;唐常杰;陈敏敏;李智;;可验证对象集分类器的再训练演进[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
3 陈继航;刘家锋;赵巍;唐降龙;;联机手写识别笔段特征分类器的学习方法[A];黑龙江省计算机学会2009年学术交流年会论文集[C];2010年
4 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
5 彭涛;左万利;赫枫龄;;基于链接上下文的分类器主题爬行技术(英文)[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 王岚;陈珂;迟惠生;;基于多特征组合多分类器的方法用于“与文本无关”的说话人辨认[A];第四届全国人机语音通讯学术会议论文集[C];1996年
7 谢秋玲;;应用于心电图分类的KNN-SVM分类器研究[A];2006中国控制与决策学术年会论文集[C];2006年
8 胡琼;汪荣贵;胡韦伟;孙见青;;基于级联分类器的快速人脸检测方法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 李兰春;王双成;杜瑞杰;;认知结构评估的动态贝叶斯网络分类器方法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
10 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
相关重要报纸文章 前1条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
相关博士学位论文 前10条
1 张非;对抗逃避攻击的防守策略研究[D];华南理工大学;2015年
2 张文博;多类别智能分类器方法研究[D];西安电子科技大学;2014年
3 许劲松;智能交通中目标检测与分类关键技术研究[D];南京理工大学;2014年
4 余家林;普通场景视频人脸检测与识别的关键技术研究[D];浙江大学;2016年
5 赵作林;基于图像分析的北京地区杨树种类识别研究[D];北京林业大学;2015年
6 任亚峰;基于标注和未标注数椐的虚假评论识别研究[D];武汉大学;2015年
7 曹鹏;不均衡数据分类方法的研究[D];东北大学;2014年
8 刘明;分类器组合技术研究及其在人机交互系统中的应用[D];北京交通大学;2008年
9 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
10 王U,
本文编号:1793694
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/1793694.html