当前位置:主页 > 科技论文 > 软件论文 >

数据挖掘下的生物信息特征提取模式分析

发布时间:2020-10-16 19:58
   随着生物数据量的剧增,摆在我们面前最重要的问题就是如何分析和研究如此庞大的生物数据,阐明其中所包含的生物意义。在此背景下,生物信息学孕育而生。生物信息学的研究涉猎广泛,包括生物信息数据库的建立与评估、序列比对、蛋白质比对、基因识别、药物设计等众多领域。本文主要综合运用各种数据挖掘的方法,侧重研究序列比对、中医诊断信息的数据化与定量化以及关联规则模型的验证。分析其中生物信息特征提取模式,进而提取有价值的生物信息。具体工作如下:在第一章中,简单介绍了生物信息学的相关内容,数据挖掘的相关知识以及本文的主要工作和创新点。在第二章中,研究距离最近字符串问题,针对这一组合优化问题采用一种基于概率启发式算法,即GRASP-CSP算法。但该算法仍存在每次迭代过程相对独立,搜索范围狭窄,判断指标过于单一这三大问题,给出了基于GRASP-CSP改进之后的新算法,即IGRASP-CSP算法。在第三章中,运用数学建模对指纹图谱取像并计算,对中医诊断信息提取数据化、定量化进行研究。给出了四种常见疾病指纹序列的CGR图的建立方法,进而给出了四种常见疾病指纹序列中同义指纹序列的相对使用度的定义QRSFU。利用SPSS软件和SAS软件,对指纹图谱做了相关分析。在第四章中,运用关联规则挖掘方法研究由因求果、由果溯因的问题。利用旅游数据进行模型设计验证。实际调研获取数据,从有效问卷中挖掘数据库中的因果关联。最后,在统计分析手段的基础上建立了有效的计算模型。在第五章中,对研究工作进行了总结与展望。
【学位单位】:江南大学
【学位级别】:硕士
【学位年份】:2016
【中图分类】:Q811.4;TP311.13
【文章目录】:
摘要
Abstract
第一章 绪论
    1.1 生物信息学简介
        1.1.1 生物信息学的背景与定义
        1.1.2 生物信息学的产生与发展
    1.2 数据挖掘简介
        1.2.1 数据挖掘的含义和基本流程
        1.2.2 数据挖掘的意义
    1.3 本文的主要工作与创新点
第二章 改进GRASP-CSP算法研究生物序列比对问题
    2.1 前言
    2.2 算法的准备
        2.2.1 基本的记号
        2.2.2 CSP的定义
        2.2.3 GRASP-CSP算法的简介
    2.3 改进的IGRASP-CSP算法
        2.3.1 扩大局部搜索范围
        2.3.2 强化策略
        2.3.3 Pareto优化
        2.3.4 改进的IGRASP-CSP算法的伪代码
    2.4 算法对比实验
    2.5 小结
第三章 基于QRSFU模型的指纹图谱与疾病的相关性研究
    3.1 前言
    3.2 资料与方法
        3.2.1 一般资料
        3.2.2 混沌游走方法
        3.2.3 拟氨基酸编码方法及QRSCU
    3.3 结果和讨论
        3.3.1 指纹与疾病
        3.3.2 指纹与手指
        3.3.3 指纹与血型
    3.4 小结
第四章 基于关联规则挖掘方法的数据分析及其实验验证
    4.1 前言
    4.2 关联规则挖掘以及Apriori算法
    4.3 利用旅游数据进行模型设计验证
        4.3.1 问题的提出
        4.3.2 问题的分析
        4.3.3 问题的解答
    4.4 关联规则挖掘结果分析
    4.5 小结
第五章 主要结论与展望
    5.1 主要结论
    5.2 展望
致谢
参考文献
附录1:作者在读研究生期间已发表与录用论文
附录2:疾病指纹序列
附录3:疾病指纹序列的CGR

【相似文献】

相关期刊论文 前10条

1 陈伟;瞿晓;葛丁飞;;主观引导特征提取法在光谱识别中的应用[J];科技通报;2011年04期

2 张剑清,J.A.R.Blais;运用信息论进行特征提取[J];测绘学报;1990年03期

3 高湘萍;吴小培;沈谦;;基于脑电的意识活动特征提取与识别[J];安徽大学学报(自然科学版);2006年02期

4 杨丽梅;郭立红;;天空背景下飞行器结构特征提取的新方法[J];光学技术;2007年03期

5 陈振洲;邹丽珊;;核Foley-Sammon变换[J];广州大学学报(自然科学版);2007年04期

6 王江晴;万晨;;周边方向贡献度在脱机手写女书特征提取中的应用[J];中南民族大学学报(自然科学版);2010年03期

7 李华平;;基于多特征提取的识别算法数学建模优化研究[J];哈尔滨师范大学自然科学学报;2013年04期

8 张绍武;潘泉;赵春晖;程咏梅;;基于加权自相关函数特征提取法的多类蛋白质同源寡聚体分类研究[J];生物医学工程学杂志;2007年04期

9 呼声波;刘希玉;;网页分类中特征提取方法的比较与改进[J];山东师范大学学报(自然科学版);2008年03期

10 李乡儒;;光谱数据挖掘中的特征提取方法[J];天文学进展;2012年01期


相关博士学位论文 前10条

1 易军;人脸识别中的特征提取与度量学习算法研究[D];北京邮电大学;2015年

2 段佳;SAR/ISAR目标电磁特征提取及应用研究[D];西安电子科技大学;2015年

3 冯博;雷达高分辨距离像特征提取与识别方法研究[D];西安电子科技大学;2015年

4 沈虹;固体振动产生非平稳信号的特征提取及检测系统的研究[D];河北工业大学;2015年

5 张妮;基于流形特征提取的化工过程故障诊断方法研究[D];中国石油大学(华东);2013年

6 陈斌;连续语音识别特征提取与声学模型训练区分性技术研究[D];解放军信息工程大学;2015年

7 游大涛;基于听觉机理的鲁棒特征提取及在说话人识别中的应用[D];哈尔滨工业大学;2013年

8 赵武锋;人脸识别中特征提取方法的研究[D];浙江大学;2009年

9 杨先勇;基于信号局部特征提取的机械故障诊断方法研究[D];浙江大学;2009年

10 杨章静;基于邻域结构的特征提取及其在人脸识别中的应用研究[D];南京理工大学;2014年


相关硕士学位论文 前10条

1 韩晓爽;基于激光诱导荧光光谱的油种识别方法研究[D];内蒙古大学;2015年

2 袁芳兵;基于SVM的GSM系统上行干扰判定研究[D];华南理工大学;2015年

3 汤鹏;基于LDA的特征提取及其在人脸识别中的应用[D];河北大学;2015年

4 安磊磊;基于改进PCA和LDA的特征提取方法[D];河北大学;2015年

5 代士超;滚动轴承外圈故障机理建模及双冲击特征提取方法的研究[D];昆明理工大学;2015年

6 王瑞琦;太赫兹光谱降维特征提取及分类方法研究[D];昆明理工大学;2015年

7 江海;心音信号特征提取及分类研究[D];昆明理工大学;2015年

8 董秀青;面向协同过滤的推荐攻击特征提取及检测方法[D];燕山大学;2015年

9 井波;基于EEMD的高速列车安全性态数据的特征研究[D];西南交通大学;2015年

10 梁致汉;基于EEG的脑机接口技术研究与实现[D];天津理工大学;2015年



本文编号:2843708

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2843708.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2a0f4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com