基于多步降维和半监督学习的蛋白质质谱特征提取算法
本文关键词:基于多步降维和半监督学习的蛋白质质谱特征提取算法,由笔耕文化传播整理发布。
【摘要】:目的提出一种基于半监督学习的多步降维特征提取方法。方法算法首先运用t-test对样本特征进行筛选,初步降低特征维度;然后进行离散小波变换,对小波系数进行相对熵排序,筛选出新的特征子集;接着进行主成分分析,提取主成分;最后运用半监督学习算法BB-LLGC进行标签传递,充分提取有标记和无标记样本的判别信息。结果在公共卵巢癌数据集OC-WCX2b和公共前列腺癌数据集PC-H4上获得了99.13%和97.20%分类准确率。在浙江省肿瘤医院临床乳腺癌数据集BC-WCX2a上获得了92.78%的分类准确率和100%的敏感性。结论多步降维的特征提取方法可以有效降低SELDI质谱数据的特征维度,结合半监督学习算法BB-LLGC,可以获得较好的分类效果。
【作者单位】: 杭州电子科技大学生物医学工程与仪器研究所;
【关键词】: 蛋白质质谱 多步降维 半监督学习 特征提取
【基金】:国家自然科学基金资助项目(60801054,60801055) 浙江省公益性技术应用研究项目(2010C33017) 浙江省医药卫生科学研究基金资助项目(2010KYA041)
【分类号】:O212.4;R311
【正文快照】: 在没有症状的早期阶段,癌症患者的蛋白质水平已经发生变化[1],如何根据高灵敏度和高特异性的蛋白水平变化来进行癌症诊断已成为学者研究的热点。表面增强激光解析电离飞行时间质谱(SELDI-TOF-MS)[2]是目前最为可行的蛋白质高通量技术之一,许多研究者运用此技术结合生物信息处
【参考文献】
中国期刊全文数据库 前3条
1 刘军莲;李勇枝;高建义;盖玉清;王静;薛春美;辛冰牧;;蛋白质组学技术研究进展[J];航天医学与医学工程;2009年02期
2 王雪松;张晓丽;程玉虎;;一种简洁局部全局一致性学习[J];控制与决策;2011年11期
3 罗凯旋;钟凡;赵亮;贺福初;;评估几种降维分类器应用于生物质谱数据的性能[J];中国科学:生命科学;2010年06期
【共引文献】
中国期刊全文数据库 前3条
1 赵楠;王桂媛;王玲姝;杨雪;李玉花;;蛋白质组学关键技术研究进展[J];生物技术通讯;2011年04期
2 周东辉;赵付荣;袁子国;朱兴全;林瑞庆;;蛋白质组学研究技术及其在弓形虫研究中的应用[J];畜牧与兽医;2011年02期
3 誉倩文;袁建辉;唐焕文;;血清蛋白质组技术及其在预防医学中应用[J];中国职业医学;2013年03期
中国硕士学位论文全文数据库 前4条
1 黄开顺;5-氟尿嘧啶诱导A549细胞凋亡细胞内外药物定量分析及蛋白质组学研究[D];重庆医科大学;2011年
2 陈松;SI甘蓝亲和授粉早期差异蛋白质研究[D];西南大学;2012年
3 高丽;评估几种流行学习降维分类器应用于癌症数据的性能[D];天津师范大学;2012年
4 曾白华;肺炎克雷伯氏菌的蛋白质组学分析[D];泸州医学院;2012年
【相似文献】
中国期刊全文数据库 前10条
1 赵琨;孔祥纬;田英杰;;带有多面体扰动的半监督v-支持向量分类机[J];中国管理科学;2010年01期
2 ;[J];;年期
3 ;[J];;年期
4 ;[J];;年期
5 ;[J];;年期
6 ;[J];;年期
7 ;[J];;年期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国博士学位论文全文数据库 前3条
1 黄亮;社会网络中的社区发现与链接预测算法研究[D];华中科技大学;2012年
2 贺英;基于半监督和迁移学习的近红外光谱建模方法研究[D];中国海洋大学;2012年
3 侯臣平;基于图优化框架的数据维数约简方法及应用研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前5条
1 孔健;基于半监督学习的社团划分算法研究[D];辽宁师范大学;2010年
2 吴黎霞;基于半监督学习的时间序列分类研究与实现[D];大连理工大学;2011年
3 孔明明;无线电干扰信号发现与识别的研究[D];西华大学;2010年
4 于文韬;基于半监督多示例的径向基函数网络模型及学习算法研究[D];东北石油大学;2011年
5 王永曦;矩阵填充应用于文本分类的一些探索[D];清华大学;2012年
本文关键词:基于多步降维和半监督学习的蛋白质质谱特征提取算法,,由笔耕文化传播整理发布。
本文编号:485329
本文链接:https://www.wllwen.com/yixuelunwen/jichuyixue/485329.html