当前位置:主页 > 科技论文 > 软件论文 >

SNP选择技术及精神分裂症诊断系统的设计与实现

发布时间:2022-01-26 20:43
  精神分裂症是一种复发率高、发病周期长的遗传疾病,多起病于青壮年时期,给患者及家庭带来很多负担。而基于单核苷酸多态性(Single Nucleotide Polymorphism,SNP)的全基因组关联研究(Genome-Wide Association Study,GWAS)虽然已经在精神分裂症的诊断研究中取得了显著的成果,但SNP位点之间存在较多的冗余,因此,要想将SNP数据应用于复杂疾病的诊断中,就必须选择具有代表性的信息SNP子集。随着数据分析处理技术的发展,研究者可以通过机器学习从大量数据中挖掘疾病的致病机制并设计诊断模型。本文以精神分裂症为研究对象,主要探讨SNP位点的选择方法与诊断模型的构建。首先提出基于改进蚁群算法的信息SNP子集选择方法,从所有SNP中选择具有代表性的特征SNP子集,以降低冗余及噪声信息;然后设计基于随机森林的精神分裂症诊断模型;最后设计并实现精神分裂症诊断系统。本文主要包含以下三个内容:(1)针对现有信息SNP选择方法中没有考虑SNP数据体现病例SNP数据的特点,本研究基于蚁群算法提出了一种新的特征选择方法,并将其运用在SNP的选择中。本文将SNP数据... 

【文章来源】:江苏大学江苏省

【文章页数】:72 页

【学位级别】:硕士

【部分图文】:

SNP选择技术及精神分裂症诊断系统的设计与实现


二分类样本中支持向量机与间隔图

信息,数据集,组合标记,投票法


SNP 选择技术及精神分裂症诊断系统的设计与实现rin 等人[65]设计了一种最大投票法 STAMPA 用于预测,该相似的信息 SNP 位点推测出待预测的位点。在仿生智能进蚁群算法与粒子群算法 BPSO[66]类似,BPSO 与 STAMPA,而与 MLR 则组合为 BPSO/MLR,本文方法改进蚁法组合标记为 ACO/KNN。用 ACO/KNN、BPSO/STAMPA 和 BPSO/MLR 三种算法验,并比较每种算法的预测准确度。每个算法分别在数据于给定的信息 SNP 数量,其结果如图 3.3 和图 3.4 所示(结果取均值)。

信息,数据集,均值


并比较每种算法的预测准确度。每个算法分别在数据对于给定的信息 SNP 数量,其结果如图 3.3 和图 3.4 所示(对结果取均值)。图 3.3 数据集 E144 上信息 SNP 对非信息 SNP 的预测准确度

【参考文献】:
期刊论文
[1]伴激越精神分裂症患者的住院干预措施和治疗结局[J]. 苏中华,张明,张怀晨,徐芳芳,王中刚,张鸿燕.  中国心理卫生杂志. 2016(07)
[2]基于多标签ReliefF的特征选择算法[J]. 黄莉莉,汤进,孙登第,罗斌.  计算机应用. 2012(10)

博士论文
[1]单核苷酸多态性数据挖掘方法及其应用研究[D]. 李雄.湖南大学 2015



本文编号:3611140

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3611140.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户47acc***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com