TSP算法在时序基因分类中的研究与应用
本文选题:基因分类 切入点:时间序列基因 出处:《郑州大学》2017年硕士论文 论文类型:学位论文
【摘要】:在生物信息学中,从大量数据中挖掘对研究有价值的信息越来越受到研究人员的重视。时序基因表达数据是生物生长过程中不同时间点采集的基因数据,作为研究热点之一的时间序列基因数据挖掘也越来越受到研究者们广泛关注和研究。时间序列基因数据分类是一个非常重要的课题,它包含了大量与时间相关的生物信息。由于基因表达数据的“高维、小样本”特点。传统的机器学习方法在处理高维数据上不仅会建立复杂的分类模型,而且得到的分类结果很难用生物学的角度理解。最高得分对算法(Top Scoring Pairs,TSP)是利用少量特征对对样本进行预测的分类器,此算法在处理基因数据上达到了很好的效果,但还不能处理时间序列基因表达数据。为了充分利用TSP算法优势,本文提出动态最高得分对算法(Dynamic Top Scoring Pairs,DTSP),将TSP算法改进为能处理时序基因数据的分类器。本文的主要工作如下:1.本文提出DTSP算法,将趋势的思想融入TSP算法中,使其能够处理时序基因。DTSP算法不仅考虑了相邻时间点的差异趋势,并且将差异的值的大小考虑进去,提高了分类准确率。同时算法也改进了预测模型,用趋势的规则进行预测。本文使用时序基因数据集进行实验,将DTSP算法和支持向量机、K近邻算法做横向对比,并将DTSP算法中包含的三种算法做纵向对比。实验证明,改进后的分类器得到了很高的分类效果,选出了最具分类能力的特征对。选出的特征对将对生物学基因研究提供了新的思路。2.在动态最高得分对算法理论的基础上,本文设计了基于DTSP算法的时序基因分类系统。该系统不仅实现了DTSP算法对时序基因的分类,同时兼容传统的机器学习分类算法,能够为用户提供二次开发的接口,集成自定义的时序基因分类算法。该系统不仅能对时序基因分类,而且可以将DTSP计算出的最高特征对展示出来,可以用于医疗生物学的进一步研究。
[Abstract]:In bioinformatics, researchers pay more and more attention to mining valuable information from a large amount of data. As one of the research hotspots, time series gene data mining has been paid more and more attention by researchers. Classification of time series gene data is a very important subject. It contains a lot of time-related biological information. Because of the "high dimension, small sample" characteristics of gene expression data, traditional machine learning methods not only build complex classification models in processing high-dimensional data. The results obtained are difficult to understand from a biological point of view. The highest score pair algorithm, Top Scoring Pairsp, is a classifier that uses a small number of features to predict samples, and the algorithm achieves good results in the processing of genetic data. In order to make full use of the advantage of TSP algorithm, In this paper, a dynamic Top Scoring pairsn DTSP algorithm is proposed, and the TSP algorithm is improved to be a classifier capable of processing temporal gene data. The main work of this paper is as follows: 1.The DTSP algorithm is proposed in this paper, which integrates the trend idea into the TSP algorithm. The algorithm not only considers the trend of the difference between adjacent time points, but also takes the value of the difference into account, which improves the classification accuracy, and also improves the prediction model. In this paper, the DTSP algorithm and the support vector machine (SVM) nearest neighbor algorithm are compared horizontally, and the three algorithms contained in the DTSP algorithm are compared longitudinally. The improved classifier has obtained a high classification effect and selected the most capable feature pairs. The selected feature pairs will provide a new way of thinking for the study of biological genes. 2. Based on the theory of dynamic maximum score pair algorithm, In this paper, a sequential gene classification system based on DTSP algorithm is designed, which not only realizes the classification of sequential genes by DTSP algorithm, but also is compatible with the traditional machine learning classification algorithm, and can provide a secondary development interface for users. The system can not only classify sequential genes, but also display the highest characteristic pairs calculated by DTSP, which can be used in the further study of medical biology.
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q811.4
【相似文献】
相关期刊论文 前10条
1 李建更;郭庆雷;贺益恒;;时序基因表达缺失值的加权双向回归估计算法[J];数据采集与处理;2013年02期
2 施建华;;机械化升级改造前后煤矿对环境空气中TSP质量浓度贡献的变化[J];科技情报开发与经济;2010年23期
3 朱宝龙,陈强,魏有仪,王鹰;TSP超前地质预报在圆梁山隧道施工中的应用[J];水文地质工程地质;2003年01期
4 韩贵锋,马乃喜;西安市大气TSP污染的健康损失初步分析[J];西北大学学报(自然科学版);2001年04期
5 张霖;;TSP分布在评价盆地油田规模及分布中的应用[J];中国海上油气;1991年06期
6 宁爱兵;马良;王周缅;;瓶颈TSP下界快速算法[J];科学技术与工程;2006年09期
7 宋锦娟;白艳萍;;一种改进的蚁群算法及其在TSP中的应用[J];数学的实践与认识;2012年18期
8 徐伯庆,孙国强;基于聚类描述的培养算子与TSP求解[J];上海理工大学学报;2000年03期
9 田富鹏;改进型蚁群算法及其在TSP中的应用[J];兰州大学学报;2005年02期
10 袁明生;陈建平;廖俊;;TSP在软、硬岩地层中的应用效果分析[J];西北地震学报;2008年02期
相关会议论文 前5条
1 吕新全;曹风雨;李军;陈再蓉;阿米娜;吐尼沙;吉利力;李惠翔;;乳腺浸润性导管癌中TSP表达、微血管密度维汉差异的研究[A];中华医学会病理学分会2005年学术年会论文汇编[C];2005年
2 裴宗平;韩宝平;郝红艳;罗云建;王浩正;;扫描电镜分析在徐州市大气颗粒物(TSP)源解析中的应用研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
3 陈俊栋;刘继滨;苏有财;李苍松;;关于断层的TSP测试数据后分析的讨论[A];2009’中国西部地区声学学术交流会论文集[C];2009年
4 廖代强;马力;向波;;重庆市区能见度与TSP关系的变化分析[A];第五届全国优秀青年气象科技工作者学术研讨会学术论文集[C];2002年
5 江雪丰;周希瑗;程玲;;TSP—1在早期糖尿病大鼠视网膜的表达及意义[A];中华医学会第十二届全国眼科学术大会论文汇编[C];2007年
相关重要报纸文章 前1条
1 中国联通研究院网络技术研究中心泛在网组网络技术研究中心 张凤全 记者 赵艳秋、李映 整理;通信运营商最有实力成为TSP[N];中国电子报;2011年
相关硕士学位论文 前8条
1 吴凯敏;TSP算法在时序基因分类中的研究与应用[D];郑州大学;2017年
2 刘程;TSP中Pb的常规监测技术探讨及其在昌吉市的应用[D];昌吉学院;2016年
3 许策;TSP隧道代理实现及安全增强型技术研究[D];哈尔滨工业大学;2014年
4 巴洪涛;DVS系统RTSP服务器软件设计与实现[D];浙江大学;2010年
5 王野;微波消解法—快速测定TSP大气颗粒物中的铅含量[D];吉林大学;2012年
6 关巍;可信软件栈中TSP的研究与应用[D];东北大学;2010年
7 吴荣纲;TSP肥料用氯化铵在马来西亚销售策略研究[D];河北工业大学;2014年
8 谢岚;“TSP功能性预混料”对苏太猪肉质性能、氨基酸和微量元素的影响研究[D];湖南农业大学;2007年
,本文编号:1640112
本文链接:https://www.wllwen.com/shoufeilunwen/benkebiyelunwen/1640112.html