基于主成分分析和迭代自组织数据分析的阿尔茨海默病致病候选基因的识别
发布时间:2017-10-13 12:10
本文关键词:基于主成分分析和迭代自组织数据分析的阿尔茨海默病致病候选基因的识别
更多相关文章: 主成分分析 迭代自组织数据分析 AD候选基因 共表达基因 孤立点基因 致病机制
【摘要】:阿尔茨海默病(Alzheimer’s disease,AD)是一种最常见的痴呆,它的致病机理还没有搞清楚。为了深入理解它的致病机制,,基因芯片微阵列数据及其分析变得很有意义,并且这方面的研究已经取得了一定进展。因此,本文先介绍了前人的工作:观察数据发现基因表达水平行向量之间的强线性相关性特征,进而利用主成分分析法对与AD相关的基因芯片微阵列数据进行降维处理,并发现列数据的紧致聚类特征,并基于此,设计一维聚类算法,估计出原始数据类的信息(类个数和类中心)。但是,我们发现尽管第一主成分已经占了大多数信息(约90%),但是剩余的10%的信息也是重要的。因此,本文提出利用一个能够吸取原有结果的经验对聚类结果进行再调整的高维算法想法,即迭代自组织数据分析算法,进一步对估计出来的类和类的个数进行优化,期望得到一个理想的聚类模式。然后利用该聚类模式,采用共轭表达判据和紧致破缺判据,识别出了37个AD候选基因,已有9个得到其他团队研究的支持。此外,对这些这些基因还做了生物学分析,得到一些AD深层次的信息:主要涉及细胞的信号传导(ECE1,PLD2和PHB),炎症(il17a),泛素标记蛋白降解(UBC)和蛋白质合成(rpl32,rps6,rpl23a和rps19)与AD密切相关。另外,本文还讨论了基因TPT1和TUBA1A对AD的潜在影响。最后,基于上述讨论本文给出了清晰明确的AD病潜在致病机制通路图。
【关键词】:主成分分析 迭代自组织数据分析 AD候选基因 共表达基因 孤立点基因 致病机制
【学位授予单位】:四川师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:R749.16
【目录】:
- 摘要4-5
- Abstract5-8
- 1 绪论8-11
- 1.1 阿尔茨海默病研究现状8
- 1.2 基因芯片技术及其应用8-10
- 1.3 本文研究的目的和意义10
- 1.4 本文的主要工作10-11
- 2 预备知识11-22
- 2.1 阿尔茨海默病基因芯片数据的组织方式11-12
- 2.2 阿尔茨海默病基因芯片数据的两个特征12-17
- 2.3 基于上述特征的一维聚类算法17-21
- 2.4 本章小结21-22
- 3 基于 PCA 一维聚类的迭代自组织数据分析算法22-28
- 3.1 算法原理与步骤22
- 3.2 算法的参数设计22-23
- 3.3 算法的 MATLAB 实现过程23-26
- 3.4 算法的收敛性26-27
- 3.5 本章小结27-28
- 4 阿尔茨海默病候选基因的识别方法28-31
- 4.1 紧致性概念的简介28
- 4.2 基因的共表达和数据的紧致性28-29
- 4.3 基因识别的两种判据29-30
- 4.4 本章小结30-31
- 5 阿尔茨海默病候选基因的实验结果31-34
- 5.1 伴随基因的识别31-32
- 5.2 孤立点基因的识别32-33
- 5.3 本章小结33-34
- 6 阿尔茨海默病候选基因研究34-42
- 6.1 伴随基因研究34-36
- 6.2 孤立点基因研究36-40
- 6.3 候选基因潜在的致病机理40-41
- 6.4 本章小结41-42
- 7 结论42-43
- 参考文献43-46
- 附录46-53
- 致谢53
【参考文献】
中国期刊全文数据库 前1条
1 赵瑾;周华东;黄丽华;李惠允;;内皮素转化酶1启动子区T-839G基因多态性与颈动脉粥样硬化的相关性[J];中国脑血管病杂志;2009年07期
本文编号:1024755
本文链接:https://www.wllwen.com/yixuelunwen/jsb/1024755.html
最近更新
教材专著