蚁群算法在求解阿尔茨海默病最优微阵列上的应用
发布时间:2020-11-21 22:09
阿尔茨海默病是一种最常见的痴呆症。这种疾病的特点是会导致病人的认知记忆、定向、判断和推理等能力衰退并最终导致死亡。2006年,全球就有2.66亿阿尔茨海默病患者,预计到2050年,全球中每85个人中将会有一个是阿尔茨海默病患者。然而到目前为止,还没有找到特别有效的措施来治疗阿尔茨海默病。为了能够彻底的治疗阿尔茨海默病,就必须能够了解阿尔茨海默病的发病原理,也就必须要找到阿尔茨海默病的致病基因。所以寻找阿尔茨海默病的致病基因是目前的一项主要研究。目前寻找阿尔茨海默病致病基因采取的主要方法,是通过分析DNA微阵列数据寻找阿尔茨海默病的候选致病基因。而分析DNA微阵列数据的其中一种方法是将表达相似的基因放在一起(因为它们很可能在功能上也相似)。传统的聚类方法只注重聚类结果,忽略了类中数据的排列问题,然而将功能相似的基因聚在一起必须考虑基因的排列问题。因此,本文首先将求解阿尔茨海默病的全局最优排列问题转化为TSP问题,然后引入目前流行的智能算法——蚁群算法(Ant Colony Optimization)及其改进算法来解决此问题。主要研究内容如下:? (1).综述了阿尔茨海默病,基因芯片技术,寻找阿尔茨海默病致病基因的研究现状,以及应用全局优化思想求解最优DNA微阵列序列的主要方法。? (2).首先应用基本蚁群算法对酵母菌基因数据进行处理,并分析讨论了三种度量方式在求解最优基因序列中的优劣;然后引入信息熵并将其作为蚁群算法的结束判据,智能判断蚁群算法的迭代次数并减少运行时间,而且在实验结果中我们可以得出改进的蚁群算法在处理大规模数据时的优势更明显;最后我们将蚁群分为两类,并在迭代过程中减少蚁群规模,然后还以信息熵作为收敛判据,在大大加快运行速度的同时获得了与基本蚁群算法几乎一致的解。?
【学位单位】:四川师范大学
【学位级别】:硕士
【学位年份】:2011
【中图分类】:R749.16;TP301.6
【部分图文】:
图 1 自然界中的蚂蚁觅食过程模拟 图 1 中,假设 A 点为蚂蚁巢穴,E 点为食物源,C、H 为障碍物。由于障碍物的存在,蚂蚁要想从 A 点到达 E 点,或者从 E 点返回 A 点,只能通过 H 点或 C点绕过障碍物,各点之间的距离如图 1(a)所示。假设每个单位时间内有 30 只蚂蚁由 A 点到达 B 点,有 30 只蚂蚁由 E 点到达 D 点,每只蚂蚁经过后留下的信息素为 1。设该物质(信息素)停留时间为 1。在初始时刻,由于路径 BH、BC、DH、DC 上信息素是相同的,则位于 B 点和 D 点的蚂蚁可以随机选择路径,可以认为蚂蚁以相同的概率选择 BH、BC、DH、DC,如图 1(b)所示。经过一个时间单位后,残留在路径 BCD 上的信息量是路径 BHD 上信息量的两倍。又经过一段时间,将有 20 只蚂蚁由 B 点和 D 点到达 C 点,有 10 只蚂蚁由 B 点和 D 点到达 H 点,如图 1(c)所示。随着时间的推移,更多的蚂蚁将选择路径 BCD,甚至最终将会完全选择路径 BCD,从而整个蚁群就找到了从蚁穴到食物源之间的最短路径。由此可见,蚂蚁个体之间的信息交换是一个正反馈过程。
结论如下: (1) 不同的度量方式将产生不同质量的基因序列;(2) 与 Pearson 度量和 Euclidean 度量相比,Euclidean 度量的平方产生最优的基因序列,尽管 Pearson 度量是当前最常用的基因相似性度量方式。(a) (b) (c) (d) 图 3. 最优序列热图(Heat map) 此图是用 TreeView 软件显示蚁群算法求得的最优酵母菌基因序列热图,(a)是原图,(b)、(c)、(d)是用蚁群算法分别和公式(1)、(2)、(3)求得的最优酵母菌序列热图。每一行表示一个基因表达数据,每一列表示一个实验条件,颜色相近的基因表示两个基因相似。从四幅图我们可以得出,对于蚁群算法,Euclidean 的平方能产生 2 个度量方式更好的基因序列,而不是经常用的 Pearson 度量。
【参考文献】
本文编号:2893673
【学位单位】:四川师范大学
【学位级别】:硕士
【学位年份】:2011
【中图分类】:R749.16;TP301.6
【部分图文】:
图 1 自然界中的蚂蚁觅食过程模拟 图 1 中,假设 A 点为蚂蚁巢穴,E 点为食物源,C、H 为障碍物。由于障碍物的存在,蚂蚁要想从 A 点到达 E 点,或者从 E 点返回 A 点,只能通过 H 点或 C点绕过障碍物,各点之间的距离如图 1(a)所示。假设每个单位时间内有 30 只蚂蚁由 A 点到达 B 点,有 30 只蚂蚁由 E 点到达 D 点,每只蚂蚁经过后留下的信息素为 1。设该物质(信息素)停留时间为 1。在初始时刻,由于路径 BH、BC、DH、DC 上信息素是相同的,则位于 B 点和 D 点的蚂蚁可以随机选择路径,可以认为蚂蚁以相同的概率选择 BH、BC、DH、DC,如图 1(b)所示。经过一个时间单位后,残留在路径 BCD 上的信息量是路径 BHD 上信息量的两倍。又经过一段时间,将有 20 只蚂蚁由 B 点和 D 点到达 C 点,有 10 只蚂蚁由 B 点和 D 点到达 H 点,如图 1(c)所示。随着时间的推移,更多的蚂蚁将选择路径 BCD,甚至最终将会完全选择路径 BCD,从而整个蚁群就找到了从蚁穴到食物源之间的最短路径。由此可见,蚂蚁个体之间的信息交换是一个正反馈过程。
结论如下: (1) 不同的度量方式将产生不同质量的基因序列;(2) 与 Pearson 度量和 Euclidean 度量相比,Euclidean 度量的平方产生最优的基因序列,尽管 Pearson 度量是当前最常用的基因相似性度量方式。(a) (b) (c) (d) 图 3. 最优序列热图(Heat map) 此图是用 TreeView 软件显示蚁群算法求得的最优酵母菌基因序列热图,(a)是原图,(b)、(c)、(d)是用蚁群算法分别和公式(1)、(2)、(3)求得的最优酵母菌序列热图。每一行表示一个基因表达数据,每一列表示一个实验条件,颜色相近的基因表示两个基因相似。从四幅图我们可以得出,对于蚁群算法,Euclidean 的平方能产生 2 个度量方式更好的基因序列,而不是经常用的 Pearson 度量。
【参考文献】
相关期刊论文 前1条
1 单连峰;李明;张惠丹;周宝森;;GLRT和LS_SVM应用于基因表达数据分类[J];数学的实践与认识;2010年09期
本文编号:2893673
本文链接:https://www.wllwen.com/yixuelunwen/jsb/2893673.html
最近更新
教材专著