当前位置:主页 > 科技论文 > 基因论文 >

基于基因表达数据的肿瘤分类方法研究

发布时间:2016-08-03 21:13

  本文关键词:基于基因表达数据的肿瘤分类算法研究,由笔耕文化传播整理发布。


《重庆大学》 2012年

基于基因表达数据的肿瘤分类方法研究

于攀  

【摘要】:当今社会随着人们生活水平的提高以及生活习惯、饮食习惯的改变,肿瘤的发病率和死亡率迅速上升,已成为威胁人类健康的主要疾病。肿瘤的早期诊断和治疗是减少肿瘤患者死亡率的关键。 临床上常用的肿瘤检查方法包括有创检查和无创检查。不管是有创还是无创检查,都需要根据检查结果做出诊断,即分类。但当前的肿瘤分类技术高度依赖于病理学工作者对肿瘤组织的主观判断,靠他们的观察诊断难以避免经验差异、疲劳疏忽等人为因素的影响,误诊、漏诊等情况时有发生。而基于基因表达数据的肿瘤分类系统能够避免人为的主观因素带来的误判,完全基于客观的数据做出客观的评价,因此一个速度快,准确率高的分类系统是当前基于基因表达数据的肿瘤分类所面临的最大困难。 而基因表达数据呈现高维小样本的特性,并且由于人为因素、环境改变等也会引入复杂的噪声。如果直接对其进行分类,误差太大,因此在分类之前必须采用有效的降维算法对其进行维数约简(即特征提取)。本文在分析传统的降维算法(如PCA、LDA、LPP、NPE等)的同时,引入了子空间的图嵌入降维算法,并将这些降维算法及其扩展置于图嵌入框架中。然而这些方法都要分解稠密矩阵,使得运算时间和耗费的物理内存迅速上升,分类正确率却不高。为了克服这些缺点,引入谱回归(Spectral Regression,SR)分析算法用于对基因表达数据进行降维。降维的最终目的是进行分类,本文实验对比分析了各种分类方法,在k-近邻的基础上提出了核空间k-近邻分类算法,同时吸取支持向量机的优点,并结合谱回归降维算法,最终将核空间k-近邻—支持向量机(KKNN-SVM)用于基因表达数据的分类。例如,在对数据集4_Tumors用谱回归进行降维后,分别用k-近邻和核空间k-近邻分类时,每类选取4个训练样本的情况下,前者识别率达到88.98%,后者为91.01%。该方法大大节省了计算机的物理开销和时间开销,,为临床诊断和治疗提供决策支持。

【关键词】:
【学位授予单位】:重庆大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP18;R730.4
【目录】:

下载全文 更多同类文献

CAJ全文下载

(如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

CAJViewer阅读器支持CAJ、PDF文件格式


【引证文献】

中国硕士学位论文全文数据库 前1条

1 孟繁驰;基因微阵列缺失点估计方法研究[D];西北农林科技大学;2013年

【参考文献】

中国期刊全文数据库 前6条

1 李衍达;以信息系统的观点了解基因组[J];电子学报;2001年S1期

2 于攀;叶俊勇;;基于谱回归和核空间最近邻的基因表达数据分类[J];电子学报;2011年08期

3 张南;刘军杰;刘志军;;基于支持向量机的模式识别方法研究[J];舰船科学技术;2006年05期

4 李霞,饶绍奇,张田文,郭政,张庆普,K.L.Moser,E.J.Topol;应用DNA芯片数据挖掘复杂疾病相关基因的集成决策方法[J];中国科学(C辑:生命科学);2004年02期

5 王文俊;张军英;;基于核的类别非局保留投影[J];模式识别与人工智能;2009年05期

6 江澎;;生物芯片:奔腾新经济[J];江苏科技信息;2004年04期

中国硕士学位论文全文数据库 前6条

1 伍亚舟;基因芯片表达数据的标准化策略研究[D];第三军医大学;2004年

2 段艳华;基于基因表达谱的肿瘤分类特征基因选择研究[D];北京工业大学;2008年

3 方明笛;猪胎盘发育后期基因表达芯片数据的统计学及生物信息学分析[D];华中农业大学;2008年

4 易辉;基因表达数据聚类分析[D];南京航空航天大学;2007年

5 孙丽娟;基于谱回归的人脸识别的研究[D];重庆大学;2009年

6 徐春归;基于微阵列数据分析的肿瘤分类方法研究[D];中国科学技术大学;2009年

【共引文献】

中国期刊全文数据库 前10条

1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期

2 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期

3 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期

4 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期

5 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期

6 章曙光;耿焕同;;一种改进的基于聚类的范例添加删除维护模型[J];安徽建筑工业学院学报(自然科学版);2006年01期

7 李永森;潘若愚;李传军;;公共设施选址优化研究[J];安徽建筑工业学院学报(自然科学版);2009年06期

8 程钢;;生物信息学课程教学改革和实践[J];安徽农学通报(上半月刊);2011年13期

9 李红梅;贺小扬;王雪冬;;粗糙集理论在农业知识发现中的应用研究[J];安徽农业科学;2008年06期

10 唐超礼;魏圆圆;;基于数据挖掘的植保预测系统[J];安徽农业科学;2008年12期

中国重要会议论文全文数据库 前10条

1 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年

2 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年

3 栾德琴;常国斌;陈国宏;;隐性白鸡不同时期肌肉组织生长相关基因的表达谱分析[A];安全优质的家禽生产——第十五次全国家禽学术讨论会论文集[C];2011年

4 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年

5 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年

6 由立真;穆志纯;;基于GHSOM网络预测客户欺诈行为[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年

7 韦艳艳;李陶深;;基于Stacking框架的学习机制研究[A];广西计算机学会2004年学术年会论文集[C];2004年

8 令狐大智;李陶深;;一种面向混合数据的自反馈模糊聚类分析算法[A];广西计算机学会2007年年会论文集[C];2007年

9 姚正;;关于决策树分类模型的评分函数研究[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年

10 原姝;;售后维修服务系统的智能化流程研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

中国博士学位论文全文数据库 前10条

1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年

2 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年

3 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年

4 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年

5 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年

6 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年

7 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年

8 陈进杰;城市轨道交通项目广义全寿命周期成本理论与应用研究[D];北京交通大学;2011年

9 张小平;主题模型及其在中医临床诊疗中的应用研究[D];北京交通大学;2011年

10 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年

中国硕士学位论文全文数据库 前10条

1 陈卫卫;耐高温水稻资源高温诱导表达蛋白鉴定与分析[D];华中农业大学;2010年

2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年

3 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年

4 张艳萍;蛋白质序列的数学描述及其应用[D];浙江理工大学;2010年

5 任秋红;油菜菌核病抗性相关基因的功能研究[D];郑州大学;2010年

6 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年

7 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年

8 刘洁;基于关联挖掘的深层网络接口模式匹配方法的研究[D];哈尔滨工程大学;2010年

9 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年

10 汪政;基于支持向量机的改进的密度聚类算法研究[D];辽宁工程技术大学;2010年

【同被引文献】

中国期刊全文数据库 前7条

1 刘连新,王秀琴,吴旻;微阵列(Microarray)技术原理及应用[J];高技术通讯;2000年04期

2 周秀梅;李作春;覃泽;;有序填充微阵列缺失数据[J];计算机工程与应用;2009年22期

3 杨涛,骆嘉伟,王艳,吴君浩;基于马氏距离的缺失值填充算法[J];计算机应用;2005年12期

4 骆嘉伟;苏涵沐;陈涛;;基于最小二乘模糊支持向量机的基因分类研究[J];计算机应用研究;2010年02期

5 王文俊;;基于传输互表达的基因表达数据聚类分析[J];模式识别与人工智能;2012年06期

6 张小白;王惠南;宋晓峰;张焕萍;;一种无参数的微阵列缺失值填补方法(英文)[J];计算机与应用化学;2007年12期

7 李强;石陆魁;刘恩海;王歌;;基于流形学习的基因微阵列数据分类方法[J];郑州大学学报(工学版);2012年05期

中国硕士学位论文全文数据库 前3条

1 孟范静;基因微阵列数据的特征提取和特征优化在癌症诊断中的应用[D];山东轻工业学院;2008年

2 孙杰;聚类算法分析在基因表达数据中的分析应用[D];江苏科技大学;2012年

3 严德春;基因微阵列数据的分析算法[D];苏州大学;2012年

【二级参考文献】

中国期刊全文数据库 前10条

1 王修竹;刘自伟;齐阳;鲍竞;;基因表达数据的预处理方法[J];兵工自动化;2006年07期

2 赵丽红;孙宇舸;蔡玉;徐心和;;基于核主成分分析的人脸识别[J];东北大学学报;2006年08期

3 虞慧婷;吴骋;柳伟伟;付旭平;贺佳;;基因调控网络模型构建方法[J];第二军医大学学报;2006年07期

4 易东,杨梦苏,李辉智,黄明辉,王文昌;一种基因芯片数据的标准化处理策略及软件实现[J];第三军医大学学报;2004年03期

5 伍亚舟,张彦琦,黄明辉,杨梦苏,曾志雄,易东;基因芯片表达数据的标准化策略研究[J];第三军医大学学报;2004年07期

6 周杰,卢春雨,张长水,李衍达;人脸自动识别方法综述[J];电子学报;2000年04期

7 李衍达;以信息系统的观点了解基因组[J];电子学报;2001年S1期

8 李颖新,阮晓钢;基于基因表达谱的肿瘤亚型识别与分类特征基因选取研究[J];电子学报;2005年04期

9 陈力学;生物信息学在基因组研究中的应用[J];国外医学.临床生物化学与检验学分册;2003年06期

10 王长本,刘兴晖,王伟灵,周新;基因表达数据的聚类分析[J];国外医学(临床生物化学与检验学分册);2004年04期

中国博士学位论文全文数据库 前1条

1 付旭平;基因芯片数据分析[D];复旦大学;2005年

【相似文献】

中国期刊全文数据库 前10条

1 李春涛;陈锋;白英龙;;一种反映数据生物特性的ART2神经网络[J];大众科技;2006年05期

2 王士同;修宇;;基于模型的基因表达聚类分析技术研究进展[J];江南大学学报(自然科学版);2006年03期

3 张黎;逄涣利;王小虎;王佳;;一种共调控基因C均值模糊聚类算法[J];计算机工程与应用;2010年07期

4 高倩倩;须文波;孙俊;;量子行为粒子群算法在基因聚类中的应用[J];计算机工程与应用;2010年21期

5 刘云如;蔡立军;易叶青;;基于G-ICA的组织样本分类算法[J];计算机工程与应用;2010年31期

6 李巧;孔薇;;改进的非负矩阵分解在基因表达数据中的应用[J];信息技术;2010年12期

7 徐旭东;郑欣;;基于Struts的基因表达数据分析软件的设计与实现[J];微电子学与计算机;2006年S1期

8 王艳;骆嘉伟;杨涛;吴君浩;;基于分段与运算的基因表达数据频繁项集挖掘[J];计算机工程与科学;2006年11期

9 曹晖;席斌;米红;;一种新聚类算法在基因表达数据分析中的应用[J];计算机工程与应用;2007年18期

10 寇晨艳;郭红;;基因表达数据的频繁模式挖掘算法[J];福州大学学报(自然科学版);2009年02期

中国重要会议论文全文数据库 前10条

1 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

2 徐旭东;郑欣;;基于Struts的基因表达数据分析软件的设计与实现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年

3 陈军;潘艳;唐世星;张吉强;易东;;小脑基因表达数据的模糊多尺度聚类分析[A];重庆市预防医学会2010年论文集[C];2011年

4 李鹏;阮晓钢;;一种预测多骨髓瘤的神经网络方法[A];第二十二届中国控制会议论文集(下)[C];2003年

5 杨波;卢学春;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物的生物信息学预测、分析和初步验证[A];第12届全国实验血液学会议论文摘要[C];2009年

6 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年

7 王章辉;赵宇海;王国仁;李源;;一种基于投影聚类的无监督表型区分算法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年

8 梅桢;申琦;冶保献;;用于基因表达数据模式识别的KNN和SVM集成算法[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年

9 张文广;李金泉;菊林花;赖双英;;应用Affymetrix基因芯片数据集开发基因表达的秩分析方法[A];遗传学进步与人口健康高峰论坛论文集[C];2007年

10 卢学春;杨波;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物及其抗白血病作用的生物信息学预测、分析和验证[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年

中国博士学位论文全文数据库 前10条

1 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年

2 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年

3 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年

4 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年

5 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年

6 刘克钦;基于生物信号通路的复杂疾病标志物识别与研究[D];上海大学;2013年

7 王广云;肿瘤基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2009年

8 张志勇;系统生物学的两个课题研究[D];上海大学;2013年

9 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年

10 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年

中国硕士学位论文全文数据库 前10条

1 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年

2 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年

3 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年

4 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年

5 张礼;寻找差异基因的概率方法研究[D];南京航空航天大学;2010年

6 张彦琦;基因调控网络建立的数学模型研究[D];第三军医大学;2003年

7 张志国;基于生成树基因表达数据聚类方法分析[D];东北大学;2006年

8 沈小乔;基因表达数据分类算法及其应用研究[D];湖南大学;2005年

9 朱婵;聚类算法在基因表达数据分析中的应用研究[D];暨南大学;2005年

10 杨小涛;支持向量机算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年


  本文关键词:基于基因表达数据的肿瘤分类算法研究,由笔耕文化传播整理发布。



本文编号:82617

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/82617.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户910d1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com