当前位置:主页 > 理工论文 > 生物学论文 >

基于迹群Lasso的子空间聚类及其在单细胞RNA序列中的应用

发布时间:2020-06-26 17:28
【摘要】:在生物信息学领域,对已测序的细胞RNA序列实行聚簇以发现细胞功能的相似性,有助于研究潜在的生物机理,进而为药物的研发或者疾病的治疗提供新的依据。近年来,伴随着复杂且冗余的生物数据的不断涌入,划分的、层次的、基于密度的、基于模型的和基于网格的传统的聚类算法往往难以或者无法取得理想的聚类准确率。子空间聚类算法以其适用于处理大规模和高维度的数据集而迅速成为研究热点。该方法容噪性高、鲁棒性强、可扩展性优,已在人脸聚类、运动分割和手写字体识别等场合中展现出良好的应用前景。然而,当直接将其应用于生物信息挖掘时,由于其忽略了生物数据内在关联的结构特征,势必将造成可解释性差和聚类效果不佳等缺陷。为此,本文在低秩表示的子空间聚类框架中嵌入了Lasso方法,提出了具有双层面表达机制的子空间聚类算法,同时发展了相应的快速求解方法,并将其成功应用到小鼠体感皮层和海马CA1的单细胞RNA序列聚类分析中。本文主要的研究内容和创新工作归纳如下:(1)提出了一种新颖的迹群Lasso(TGL)方法,利用迹Lasso方法和群Lasso方法融合的策略,实现了兼具变量水平的稀疏性、预设组稀疏性和自动组稀疏性的降维过程。在UCI的分类数据集上执行分类实验,结果表明本文所提的方法在分类精度和基因选择能力上相对于其它两种Lasso变体方法均更加优越。(2)提出了一种基于TGL的子空间聚类(TGLSC)算法,采用了结合样本和特征双层面的线性表达机制,使得聚簇方案得以在样本和特征两者的子空间下协同进行。在人脸聚类和运动分割的聚类数据集上执行聚类实验,结果表明本文所提的算法在准确性和稳定性等多个方面与其它五种子空间聚类算法相比总体上性能最佳。(3)针对所提的TGLSC算法的目标函数,引入了最为常用的交替方向乘子法(ADMM)对其进行分布式求解,并对来源于小鼠的体感皮层和海马CA1区域的单细胞RNA序列实行聚类分析,探索和揭示了若干生物科学的信息和规律。
【学位授予单位】:浙江理工大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:Q811.4;TP311.13
【图文】:

数据集,图片


4.4.1 人脸聚类实验人脸聚类指的是以待聚类的人脸的特征信息为依据比对人脸,并根据人脸的相似度值对所有的人脸图像进行分组的过程。选择两个被广泛使用的人脸数据库,即ORL数据集[80](http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html可下载资源)和Extended Yale B数据集[81,82](http://vision.ucsd.edu/~iskwak/ExtYaleDatabase/ExtYaleB.html可下载资源)作为人脸聚类实验材料。ORL数据集包含来自于40个对象的各10张,共计400张的人脸图像,每张单独的图像大小为92 112像素。Extended Yale B数据集由来自于38个对象在59至64种不同的光照和角度等条件下拍摄的超过2400张的人脸图像构成,每张单独的图像大小为168 192像素。为了确保实验的高效性,将两种数据集的各个样本分别下采样为23 28像素和42 48像素大小,两种数据集的每个样本可分别视为644维和2016维的向量。图4.1和图4.2分别展示了两种人脸聚类数据集的部分样本图片。

数据集,图片,像素


ak/ExtYaleDatabase/ExtYaleB.html可下载资源)作为人脸聚类实验材料。ORL数据集包含来自于40个对象的各10张,共计400张的人脸图像,每张单独的图像大小为92 112像素。Extended Yale B数据集由来自于38个对象在59至64种不同的光照和角度等条件下拍摄的超过2400张的人脸图像构成,每张单独的图像大小为168 192像素。为了确保实验的高效性,将两种数据集的各个样本分别下采样为23 28像素和42 48像素大小,两种数据集的每个样本可分别视为644维和2016维的向量。图4.1和图4.2分别展示了两种人脸聚类数据集的部分样本图片。图 4.1 ORL 数据集的部分样本图片

【相似文献】

相关期刊论文 前10条

1 周雅静;江维;;鲁棒的谱增强子空间聚类[J];电子世界;2019年01期

2 黎永安;王为;金舒超;;一种新的子空间聚类方法[J];有线电视技术;2017年12期

3 张彩霞;胡红萍;白艳萍;;改进的稀疏子空间聚类算法[J];火力与指挥控制;2017年03期

4 陈丽萍;郭躬德;;一种基于顺序特性的子空间聚类方法[J];计算机科学;2016年03期

5 杜静;匡泰;张丽娜;;基于混合高斯回归的子空间聚类视频火焰检测[J];科学家;2017年16期

6 刘波;王红军;成聪;杨燕;;基于属性最大间隔的子空间聚类[J];南京大学学报(自然科学);2014年04期

7 詹秀眉;李亚星;欧阳俐;朱文婷;;不同耕地空间聚类算法的对比分析研究[J];测绘与空间地理信息;2019年01期

8 吕红伟;王士同;;预测子空间聚类的聚类集成算法[J];小型微型计算机系统;2017年04期

9 傅文进;吴小俊;董文华;尹贺峰;;基于协同表示的子空间聚类[J];模式识别与人工智能;2017年03期

10 解昊;赵志刚;吕慧显;王福驰;刘馨月;;稀疏低秩子空间聚类算法[J];青岛大学学报(自然科学版);2017年03期

相关会议论文 前10条

1 徐玉峰;周丽华;肖清;;一种基于数据分布差异度的子空间聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年

2 张燕萍;姜青山;;k-means型软子空间聚类算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

3 张宝一;蒙菲;杨莉;王丽芳;吴湘滨;;顾及梯度矢量的高斯混合模型在三维属性场空间聚类中的应用[A];2017中国地球科学联合学术年会论文集(五十)——专题104:深部矿产资源评价理论方法、专题105:中国“三稀”矿产资源分布与成因[C];2017年

4 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年

5 任家东;周玮玮;何海涛;;高维数据流的自适应子空间聚类算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年

6 陈厚铭;盛剑;童朝义;;贵州卷烟品牌销量空间集聚特征研究[A];中国烟草学会学术年会优秀论文集[C];2017年

7 沈天跃;章守宇;沈蔚;;人工鱼礁实际分布状态的聚类分析[A];2014年中国水产学会学术年会论文摘要集[C];2014年

8 刘启亮;邓敏;彭东亮;徐震;;基于场论的空间聚类有效性评价方法研究[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年

9 刘建毅;王菁华;王枞;;领域语义语法的统计生成[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

10 邓羽;;广义多维云模型在空间聚类中的应用[A];地理学与生态文明建设——中国地理学会2008年学术年会论文摘要集[C];2008年

相关博士学位论文 前10条

1 王君;稀疏子空间聚类及快速算法的研究[D];哈尔滨工业大学;2019年

2 王剑亭;面向量子密钥分发安全性分析的子空间聚类算法研究[D];中国科学技术大学;2015年

3 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年

4 朱林;基于特征加权与特征选择的数据挖掘算法研究[D];上海交通大学;2013年

5 黄明;基于空间分区的空间聚类研究[D];武汉大学;2010年

6 由从哲;子空间聚类分析新算法及应用研究[D];江南大学;2017年

7 胡彩平;基于空间自相关的空间数据挖掘若干关键技术的研究[D];南京航空航天大学;2007年

8 王强;局部叠加基因表达模式聚类分析方法研究[D];哈尔滨工业大学;2012年

9 孙丽萍;半监督空间聚类方法及其在城市公共设施区位规划中的应用研究[D];安徽师范大学;2015年

10 郭锴凌;低秩分解及其在计算机视觉中的应用[D];华南理工大学;2017年

相关硕士学位论文 前10条

1 江泓;基于多密度树和场论的空间聚类算法研究[D];福州大学;2018年

2 肖秉森;图像数据的低秩表示与聚类[D];福州大学;2018年

3 刘奕志;稀疏子空间聚类算法原理及应用研究[D];山东科技大学;2018年

4 方贤;基于迹群Lasso的子空间聚类及其在单细胞RNA序列中的应用[D];浙江理工大学;2019年

5 周雅静;基于数据表示的子空间聚类算法的研究与应用[D];广东工业大学;2019年

6 路程;基于特征选择和稀疏表示的子空间聚类算法研究[D];浙江工业大学;2019年

7 李渊;大规模数据的哈希编码与聚类分析[D];国防科技大学;2017年

8 李虎;基于自表达的子空间聚类算法研究[D];厦门大学;2018年

9 叶东升;多流形嵌入子空间聚类方法研究[D];哈尔滨工程大学;2019年

10 翟义强;基于加权的稀疏低秩子空间聚类算法研究[D];南京理工大学;2018年



本文编号:2730653

资料下载
论文发表

本文链接:https://www.wllwen.com/projectlw/swxlw/2730653.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户640d7***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com