当前位置:主页 > 医学论文 > 生物医学论文 >

基于聚类分析和半监督学习的蛋白质质谱数据分类

发布时间:2019-02-21 14:12
【摘要】:目的针对高维冗余的SELDI蛋白质质谱数据,提出一种基于聚类分析和半监督学习的数据分类方法。方法算法首先运用t-test对蛋白质质谱数据进行初步降维;然后将处理后的数据用聚类分析算法进行进一步降维;最后运用半监督学习算法传递标签,充分提取有标记样本和无标记样本的信息,从而进行分类。结果在公共卵巢癌数据集OC-WCX2b和公共前列腺癌数据集PC-H4上获得了99.15%和96.75%分类准确率。在浙江省肿瘤医院临床乳腺癌数据集BC-WCX2a上获得了95.18%的分类准确率和100%的敏感性。结论基于聚类分析的半监督学习方法能够有效利用未标记的质谱样本信息,与经典的监督学习算法相比,其分类性能更理想、实用性更好。
[Abstract]:Aim to propose a data classification method based on clustering analysis and semi-supervised learning for high dimensional redundant SELDI protein mass spectrometry data. Methods at first, t-test was used to reduce the dimension of protein mass spectrum data, and then the processed data was further reduced by cluster analysis algorithm. Finally, semi-supervised learning algorithm is used to transfer labels and extract the information of labeled samples and unmarked samples, so as to classify. Results the classification accuracy was 99.15% and 96.75% in OC-WCX2b and PC-H4 respectively. The classification accuracy and sensitivity were 95.18% and 100% respectively on the clinical breast cancer data set BC-WCX2a of Zhejiang Cancer Hospital. Conclusion the semi-supervised learning method based on clustering analysis can effectively utilize unlabeled mass spectrum sample information. Compared with the classical supervised learning algorithm, its classification performance is better and its practicability is better.
【作者单位】: 杭州电子科技大学生命信息与仪器工程学院;
【基金】:国家自然科学基金(60801054,61205200) 浙江省自然科学基金(LY12F01005)
【分类号】:R318.04

【参考文献】

相关期刊论文 前5条

1 刘军莲;李勇枝;高建义;盖玉清;王静;薛春美;辛冰牧;;蛋白质组学技术研究进展[J];航天医学与医学工程;2009年02期

2 王雪松;张晓丽;程玉虎;;一种简洁局部全局一致性学习[J];控制与决策;2011年11期

3 罗凯旋;钟凡;赵亮;贺福初;;评估几种降维分类器应用于生物质谱数据的性能[J];中国科学:生命科学;2010年06期

4 游晓璐;祝磊;曹凯敏;韩斌;;基于多步降维和半监督学习的蛋白质质谱特征提取算法[J];航天医学与医学工程;2013年04期

5 杨合龙;祝磊;韩斌;厉力华;郑智国;孟旭莉;;运用近邻传播聚类分析进行SELDI-TOF蛋白质谱特征选择[J];中国生物医学工程学报;2013年01期

【共引文献】

相关期刊论文 前9条

1 周扬;戴曙光;葛丁飞;;近红外光谱稀疏分量分析检测柴油品质参数[J];光学精密工程;2014年02期

2 游晓璐;祝磊;曹凯敏;韩斌;;基于多步降维和半监督学习的蛋白质质谱特征提取算法[J];航天医学与医学工程;2013年04期

3 朱宇光;闫婷;张建明;杨雄;胡维礼;;一种基于反馈模糊图论的视频多语义标注算法[J];计算机科学;2013年12期

4 吴永波;薛建辉;李百炼;;植物应答高温和干旱胁迫组学研究进展[J];科技导报;2014年13期

5 赵楠;王桂媛;王玲姝;杨雪;李玉花;;蛋白质组学关键技术研究进展[J];生物技术通讯;2011年04期

6 赵志梅;;基于代理模型和人工免疫系统的特征选择算法[J];计算机工程与设计;2014年06期

7 周东辉;赵付荣;袁子国;朱兴全;林瑞庆;;蛋白质组学研究技术及其在弓形虫研究中的应用[J];畜牧与兽医;2011年02期

8 誉倩文;袁建辉;唐焕文;;血清蛋白质组技术及其在预防医学中应用[J];中国职业医学;2013年03期

9 张晨光;张燕;张夏欢;;从希尔伯特-施密特独立性中学习的多标签半监督学习方法[J];中国科技论文;2013年10期

【二级参考文献】

相关期刊论文 前6条

1 李伟红;龚卫国;陈伟民;梁毅雄;尹克重;;基于SVM RFE的人脸特征选择方法[J];光电工程;2006年05期

2 刘军莲;李勇枝;高建义;盖玉清;王静;薛春美;辛冰牧;;蛋白质组学技术研究进展[J];航天医学与医学工程;2009年02期

3 王尧佳;祝磊;韩斌;厉力华;郑智国;牟瀚舟;;基于递归零空间线性判别分析算法的蛋白质质谱数据特征选择[J];航天医学与医学工程;2010年05期

4 王雪松;张晓丽;程玉虎;;一种简洁局部全局一致性学习[J];控制与决策;2011年11期

5 罗凯旋;钟凡;赵亮;贺福初;;评估几种降维分类器应用于生物质谱数据的性能[J];中国科学:生命科学;2010年06期

6 孟辉;洪文学;;蛋白质组学质谱数据预处理技术综述[J];中国生物医学工程学报;2009年03期

【相似文献】

相关期刊论文 前1条

1 游晓璐;祝磊;曹凯敏;韩斌;;基于多步降维和半监督学习的蛋白质质谱特征提取算法[J];航天医学与医学工程;2013年04期

相关会议论文 前10条

1 柳斌;李之棠;涂浩;;基于半监督学习的应用流分类方法[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年

2 葛荐;马廷淮;;基于集成算法的半监督学习研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年

3 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

4 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

5 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年

6 陈耀东;王挺;陈火旺;;半监督学习和主动学习相结合的浅层语义分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

7 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年

8 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

9 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年

10 林良宪;利德江;蔡孟璇;邱政贤;;针对小样本分类的半监督式学习法[A];第25届全国灰色系统会议论文集[C];2014年

相关博士学位论文 前10条

1 唐晓亮;基于神经网络的半监督学习方法研究[D];大连理工大学;2009年

2 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年

3 孔怡青;半监督学习及其应用研究[D];江南大学;2009年

4 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年

5 余国先;高维数据上的半监督学习研究[D];华南理工大学;2013年

6 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年

7 王娇;多视图的半监督学习研究[D];北京交通大学;2010年

8 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年

9 薛贞霞;支持向量机及半监督学习中若干问题的研究[D];西安电子科技大学;2009年

10 吕佳;基于局部学习的半监督分类问题研究[D];内蒙古大学;2012年

相关硕士学位论文 前10条

1 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年

2 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年

3 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年

4 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年

5 易星;半监督学习若干问题的研究[D];清华大学;2004年

6 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年

7 梁,

本文编号:2427574


资料下载
论文发表

本文链接:https://www.wllwen.com/yixuelunwen/swyx/2427574.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e5be6***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com