基于稀疏矩阵分解的特征基因识别方法研究
本文关键词:基于稀疏矩阵分解的特征基因识别方法研究,,由笔耕文化传播整理发布。
【摘要】:随着信息技术的进步和数据库的使用,各种各样的信息呈爆炸式增长,人们很难从海量的数据中找到有用的信息。数据库技术和机器学习的迅速发展,使得数据挖掘作为一种新的数据处理技术登上历史舞台。近年来,各种生物基因组研究相继开展,使得生物学实验数据的数量呈爆炸式增长。过去的数据分析方法已经远远不能满足实际研究的需要,稀疏矩阵分解理论作为新一代的数据挖掘技术能够很好地处理大规模基因表达数据,进一步从基因表达数据中识别出包含关键信息的特征基因,从而为生命科学更好地认识生命提供了有效的手段和方法。本文通过综合分析国内外学者对稀疏矩阵分解理论和特征基因识别算法方面的研究成果,发现其中存在部分学术研究上的缺乏,因此,笔者基于以往的研究成果,通过对数据挖掘算法进行深入研究,选择其中的特征提取作为重点研究方向,对稀疏矩阵分解展开研究,并对稀疏矩阵分解算法进行改进,提出了两种新的特征基因识别算法:基于类别信息的惩罚性矩阵分解算法和基于P范数的鲁棒特征提取算法。基于类别信息的惩罚性矩阵分解根据基因表达数据中不同的样本数得到总散度矩阵,并将总散度矩阵进行矩阵分解,重建一个新的数据矩阵,然后利用惩罚性矩阵分解对新的数据矩阵进行处理,得到稀疏特征样本,最后,根据稀疏特征样本中的非零项来识别特征基因。基于P范数的鲁棒特征提取算法利用Schattenp范数作为正则化函数来得到低秩矩阵,利用pL作为误差函数来提高对离群值的鲁棒性,因此该算法可以有效地识别特征基因。为了验证这两种算法的性能,本文分别在仿真数据集和基因表达数据集上进行实验,并同现有的方法相比较。实验结果表明,笔者提出的算法是有效可行的。本论文的创新点之一在于通过总散度矩阵引入样本类别信息,并与PMD进行结合,提出一种新的有监督特征提取算法基于类别信息的惩罚性矩阵分解算法(CIPMD)来识别特征基因,并成功将CIPMD应用在基因表达数据分析中;创新点之二是基于Schattenp范数和pL范数,提出基于P范数的鲁棒特征提取算法(PRFE)来识别特征基因。
【关键词】:稀疏矩阵分解 特征基因 基因表达数据 类别信息 惩罚性矩阵分解 P范数 鲁棒特征提取 低秩
【学位授予单位】:曲阜师范大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13;G250
【目录】:
- 摘要3-4
- Abstract4-8
- 第1章 绪论8-14
- 1.1 研究背景及意义8-9
- 1.1.1 研究背景8-9
- 1.1.2 研究意义9
- 1.2 国内外研究综述9-11
- 1.3 研究思路与方法11-14
- 1.3.1 研究思路11-12
- 1.3.2 研究方法12-14
- 第2章 相关概念解析14-24
- 2.1 稀疏矩阵分解理论概述14-18
- 2.1.1 矩阵分解理论14-16
- 2.1.2 稀疏表示理论16-18
- 2.2 特征基因识别概述18-24
- 2.2.1 基因表达数据及其特点18-19
- 2.2.2 特征基因识别方法介绍19-24
- 第3章 基于类别信息的惩罚性矩阵分解算法24-40
- 3.1 基于类别信息的惩罚性矩阵分解算法24-26
- 3.1.1 散度矩阵24-25
- 3.1.2 构建新矩阵25
- 3.1.3 惩罚性矩阵分解25-26
- 3.2 CIPMD在特征基因识别中的应用26-27
- 3.3 实验结果与讨论27-38
- 3.3.1 仿真实验结果与分析27-30
- 3.3.2 基因表达数据实验结果与分析30-38
- 3.4 小结38-40
- 第4章 基于P范数的鲁棒特征提取算法40-59
- 4.1 基于P范数的鲁棒特征提取算法40-45
- 4.1.1 P范数概念40
- 4.1.2 基于P范数的鲁棒特征提取算法40-41
- 4.1.3 算法的求解41-44
- 4.1.4 算法中p值的选择44-45
- 4.2 PRFE在特征基因识别中的应用45-46
- 4.3 实验结果与讨论46-57
- 4.3.1 仿真实验结果与分析46-49
- 4.3.2 基因表达数据实验结果与分析49-57
- 4.4 小结57-59
- 第5章 结论与展望59-62
- 5.1 研究结论59
- 5.2 研究创新点及展望59-62
- 5.2.1 研究的创新点59
- 5.2.2 研究的不足59-60
- 5.2.3 研究的展望60-62
- 参考文献62-68
- 在读期间发表的学术论文及研究成果68-70
- 致谢70
【相似文献】
中国期刊全文数据库 前10条
1 纪效霞;陈柯;;有限元中稀疏矩阵的存储[J];枣庄学院学报;2008年05期
2 李长兴;;稀疏矩阵的转置[J];计算机光盘软件与应用;2013年05期
3 史树民,董相端;稀疏矩阵在统计文件组织中的应用[J];计算机应用与软件;1987年06期
4 张兴令,郭敏燕;一个高阶稀疏矩阵的压缩存放法[J];计算机应用与软件;1987年06期
5 李昱明,董万鹏,彭颖红;基于0-1属性矩阵的矩阵压缩存贮方法研究[J];计算机工程与应用;2003年02期
6 蒋川群;杜奕;;稀疏矩阵相乘的一个改进算法[J];计算机工程与应用;2009年19期
7 任建民,张义门;模拟半导体器件的一种稀疏矩阵及其算法[J];电子科学学刊;1989年01期
8 高凤荣,杜小勇,王珊;一种基于稀疏矩阵划分的个性化推荐算法[J];微电子学与计算机;2004年02期
9 褚一平;陈勤;吴铤;;大型稀疏矩阵线形相关列的求解算法和实现方法研究[J];石油工业计算机应用;2004年04期
10 居悌;电路的计算机辅助设计——八、稀疏矩阵技术[J];微电子学与计算机;1986年08期
中国重要会议论文全文数据库 前3条
1 宋琦;陈璞;;稀疏求解—结构修改的一种新的可能性[A];北京力学会第20届学术年会论文集[C];2014年
2 徐道远;王宝庭;王向东;冯伯林;;求解大型稀疏矩阵的ICCG法[A];第八届全国结构工程学术会议论文集(第Ⅰ卷)[C];1999年
3 苑维然;陈璞;刘凯欣;;非对称线性方程组的快速外存解法[A];中国力学学会学术大会'2005论文摘要集(下)[C];2005年
中国硕士学位论文全文数据库 前10条
1 刘健;基于稀疏矩阵分解的特征基因识别方法研究[D];曲阜师范大学;2015年
2 庄立;稀疏矩阵向量乘及自动调优[D];杭州电子科技大学;2011年
3 冯广祥;大型稀疏矩阵直接求解算法的研究及实现[D];东北大学;2010年
4 丁玲;低秩与稀疏矩阵恢复问题的若干研究[D];浙江大学;2012年
5 吴超凡;基于UB树的大型稀疏矩阵存储研究[D];云南大学;2013年
6 王亚南;基于FPGA的稀疏矩阵分解实现[D];西安电子科技大学;2009年
7 赵加强;基于OpenCL的稀疏矩阵向量乘优化[D];吉林大学;2012年
8 施浩;基于FPGA的稀疏矩阵向量乘的优化研究与实现[D];南京邮电大学;2011年
9 胡耀国;基于GPU的有限元方法研究[D];华中科技大学;2011年
10 梁添;基于GPU的稀疏矩阵运算优化研究[D];华中科技大学;2012年
本文关键词:基于稀疏矩阵分解的特征基因识别方法研究,由笔耕文化传播整理发布。
本文编号:429588
本文链接:https://www.wllwen.com/tushudanganlunwen/429588.html