基因表达谱的非参缺失森林填补算法研究
本文关键词:基因表达谱的非参缺失森林填补算法研究
【摘要】:目的评估不同基因表达谱数据集下,多种算法在缺失数据中的填补效果,并分析其对无监督基因表达谱聚类的影响。方法在不同缺失比例的情况下,分别采用非参缺失森林填补法、贝叶斯线性回归法、蒙特卡洛多重填补法和K邻近填补法进行填补,通过均方根误差(NRMSE)和聚类准确率(F值)两个指标来评估不同方法的填补效能和聚类效果,并用模拟数据集进行测试和乳腺癌数据集进行验证。结果随着缺失比例的增加,四种填补方法的NRMSE都逐渐上升;任意缺失比例下,相比于其他三种方法非参缺失森林填补法的填补优势明显。缺失比例为5%、10%、20%和30%的乳腺癌数据集,非参缺失森林填补法的NRMSE依次为0.1951(95%CI,0.1945~0.1953)、0.2776(95%CI,0.2783~2791)、0.4003(95%CI,0.3986~0.4002)和0.4974(95%CI,0.4658~0.5104);聚类效果的准确率为1.0、0.91、0.88和0.82。结论非参缺失森林填补算法实现简单,对数据集的要求较低,比传统填补算法具有更好的稳定性和精确度,可保留较多的基因信息供后续的功能聚类等分析。
【作者单位】: 第三军医大学军事预防医学院卫生统计学教研室;
【关键词】: 基因表达谱 缺失数据 缺失森林法 聚类
【基金】:国家自然科学基金项目(81273178,81573254)
【分类号】:Q811.4
【正文快照】: 生物医学研究中基因表达微阵列是一种强有力的工具,但现存的很多分析方法都要求微阵列的数据是完整的。由于存在多种原因,如不充分的实验方案,图像损坏,芯片上的灰尘或划痕等,使得实际上获得的数据阵列通常是有缺失的,这在一定程度上影响了数据后续分析结果的准确性和可靠性,
【相似文献】
中国期刊全文数据库 前10条
1 汪伟;;基于数据库语言实现基因表达谱数据的单因素重复测量方差分析[J];中国医疗设备;2013年11期
2 刘玲;;基因表达谱数据分析技术[J];电脑与信息技术;2010年06期
3 黄宏斌;梁芳;熊炜;李小玲;曾朝阳;李桂源;;生物信息技术加速开发旧药新用途[J];生物化学与生物物理进展;2012年01期
4 张亮,张岩,周一鸣,安爽,果德安,周玉祥,曾令文,程京;用聚类法分析受抗真菌物质处理后的酵母细胞全基因表达谱[J];生物化学与生物物理进展;2002年04期
5 潘海燕,朱军,韩丹夫;分析基因表达谱数据的新方法(英文)[J];浙江大学学报(农业与生命科学版);2004年05期
6 葛世丽,吴德昌;基因表达系列分析及其应用[J];国外医学(放射医学核医学分册);1998年05期
7 葛芳;王年;郭秀丽;;一种改进的谱聚类算法及其在基因表达谱分析中的应用[J];安徽大学学报(自然科学版);2012年05期
8 曹文君;李运明;陈长生;;基因表达谱富集分析方法研究进展[J];生物技术通讯;2008年06期
9 阚海俊;唐俊;苏亮亮;;一种基于邻域不定性信息和记分准则相结合的肿瘤特征基因提取方法[J];安徽大学学报(自然科学版);2014年01期
10 严美娟;万明辉;李春鹏;夏春林;;两型星形胶质细胞基因表达谱差异的初步观察[J];南通大学学报(医学版);2007年01期
中国重要会议论文全文数据库 前10条
1 刘艳;李康;傅松滨;;基于小波分析理论的基因表达谱数据分析方法的研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
2 张岩;张亮;周一鸣;安爽;果德安;周玉祥;曾令文;程京;;抗真菌物质与酵母细胞作用后全基因表达谱的聚类法分析[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
3 朱明珠;高磊;李霞;;酵母基因表达相关性与蛋白质互作网络距离分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
4 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
5 许沈华;牟瀚舟;顾琳慧;朱赤红;刘祥麟;;用基因芯片筛选高转移卵巢癌转移相关的基因[A];中国细胞生物学学会医学细胞生物学学术大会论文集[C];2006年
6 包雷;过涛;孙之荣;;挖掘基因与抗癌药物间可能的生物学关联[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
7 邱广斌;郝冬梅;宫立国;李云慧;;肿瘤相关新基因MTLC的克隆及在肿瘤中的表达研究[A];第十届全军检验医学学术会议论文汇编[C];2005年
8 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第八届全国中西医结合血液病学术会议论文集[C];2007年
9 张幸国;虞朝晖;文思远;;复方丹参注射液对血管内皮细胞基因表达谱的影响研究[A];2006年浙江省药品法规与临床药理学术研讨会论文汇编[C];2006年
10 高瑞兰;林筱洁;陈小红;徐卫红;钱煦岱;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2007年浙江省血液病学术年会论文汇编[C];2007年
中国重要报纸全文数据库 前10条
1 记者 衣晓峰 通讯员 李小莲;探寻“证”的基因表达谱[N];中国中医药报;2009年
2 晓明;抑制一基因 “老”鼠换新肤[N];中国医药报;2007年
3 记者 张晔 通讯员 周伟;我学者发现多基因表达谱[N];科技日报;2014年
4 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
5 吴煜 杨宇飞 杨焕明;抗肿瘤药研究新思路[N];中药报;2000年
6 周艳萍;寻求肿瘤个体化治疗方案[N];健康报;2006年
7 赵绍华;给孩子减肥必须“饿一饿”[N];健康时报;2007年
8 解放军总医院全军肾脏病研究所教授 吴镝邋王继荣 刘泉 整理;推进肾病科研的四大利器[N];健康报;2008年
9 江苏省中医院转化医学中心 赖仁胜;肿瘤基因组 突破在云端[N];健康报;2011年
10 记者 张学全 张建松;我人类功能基因研究获重要进展[N];新华每日电讯;2000年
中国博士学位论文全文数据库 前10条
1 王翔;小麦温光反应的分子生物学研究[D];中国农业科学院;2014年
2 牛月;NCA1在拟南芥感受钠盐胁迫过程中功能的研究[D];兰州大学;2012年
3 王作昭;长白山林蛙蛙卵Onconase基因的克隆表达及其抗人乳腺癌作用研究[D];吉林大学;2016年
4 周运;基于生物网络的大鼠再生肝细胞基因表达谱数据分析[D];河南师范大学;2016年
5 张文慧;白桦BPERF11基因响应高盐干旱胁迫的调控机理研究[D];东北林业大学;2016年
6 张伟溪;杨树抗逆转录因子基因遗传转化与功能验证[D];中国林业科学研究院;2014年
7 李伍举;基于基因表达谱的样本分型与分类研究[D];中国人民解放军军事医学科学院;2003年
8 梁欣伟;人脐静脉内皮细胞基因表达谱分析[D];第一军医大学;2006年
9 蔺会云;一条新的转移相关基因mag-1的研究[D];中国人民解放军军事医学科学院;2006年
10 杨志林;恶性胶质瘤相关新基因的筛选、克隆及其特性研究[D];第一军医大学;2001年
中国硕士学位论文全文数据库 前10条
1 赵月敏;CMFT体外抑瘤活性及对肿瘤细胞基因表达谱的影响[D];河北大学;2015年
2 江月;家蚕TGF-β家族成员dpp和daw基因的功能研究[D];苏州大学;2015年
3 弓春玲;Hela细胞与人子宫内膜基质细胞中miRNA Let-7及其靶基因的关系研究[D];内蒙古大学;2015年
4 罗影涛;腺苷酸环化酶3基因敲除小鼠主要嗅觉表皮基因表达谱分析[D];河北大学;2015年
5 甘斌;基于稀疏性理论的肿瘤基因表达谱分类[D];曲阜师范大学;2015年
6 乔玲波;StOSM基因及其耐旱功能研究[D];宁夏大学;2015年
7 赵学军;家蝇CCTζ基因的cDNA克隆、表达及表达模式研究[D];贵阳医学院;2015年
8 文正勇;鳜鱼生长性状数字基因表达谱分析[D];华中农业大学;2015年
9 李晓宾;Fancd2os基因在小鼠不同组织中的表达谱分析及其真核表达载体的构建与鉴定[D];山西医科大学;2015年
10 陈辉;CIK诱导过程中TCR的表达变化及靶向TCR的基因编辑研究[D];广东药学院;2015年
,本文编号:697923
本文链接:https://www.wllwen.com/kejilunwen/jiyingongcheng/697923.html