基于先验决策模型的缺失数据谱系树构建方法研究
[Abstract]:Pedigree is an important part of life science research, and morphological data is an important basis for constructing paleontology pedigree. However, paleontology data often have missing information, resulting in the failure of traditional pedigree construction algorithm. To solve this problem, this paper proposes a priori decision-making model based on the lack of information. The specific research contents are as follows: (1) To solve the problem of constructing missing data pedigrees, a method of constructing pedigrees based on a prior decision model is proposed. Firstly, the original pedigrees are constructed by using a more complete set of species; then, the decision points are obtained by using attribute reduction principle, and then a prior decision is made. Finally, the position of the species with high missing data proportion in the initial pedigree tree is determined according to the model, and the pedigree tree is constructed by species grafting. The experimental results show that the average accuracy of the attribute decision-making set is about 10% higher than that of the maximum reduction method when the missing data proportion of a single species is greater than 10%. Combining the number of attributes to be reduced with the classification of combinatorial classes, a special encoding method, the corresponding fitness function and the crossover mutation method are proposed, which further improves the grafting of missing data species in the pedigree tree. The experimental results show that the average accuracy of species is up to 3.4% higher than that of the simple heuristic method. (3) In order to eliminate the parallel subtree caused by multiple grafting, a new method based on weight fitting hierarchical clustering is proposed to predict the parallel subtree. The least squares method is used to fit the attribute weights of the initial pedigree tree, and then weights the attributes of the merged species. Finally, a subtree is constructed by using the weighted hierarchical clustering method. The experimental results show that this method can predict the merged subtrees and eliminate the merged subtrees in the pedigree tree.
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q11;TP18
【相似文献】
相关期刊论文 前10条
1 金勇进;调查中的数据缺失及处理(Ⅰ)——缺失数据及其影响[J];数理统计与管理;2001年01期
2 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期
3 赵慧秀;马文卿;;带有缺失数据的估计方程[J];曲阜师范大学学报(自然科学版);2009年03期
4 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期
5 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期
6 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期
7 金勇进;缺失数据的偏差校正(系列三)[J];数理统计与管理;2001年04期
8 毕华,李济洪;带有缺失数据的聚类分析方法[J];华北工学院学报;2003年05期
9 李开灿;;有缺失数据的META-MARKOV模型的局部计算[J];应用数学学报;2007年03期
10 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期
相关会议论文 前10条
1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年
5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年
7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
9 张敬才;张国伍;;运用模糊数学建立投资决策模型[A];模糊数学和系统成果会论文集[C];1991年
10 黄漫宇;;零售商引入自有品牌的决策模型分析[A];首届中部地区商业经济论坛论文集[C];2007年
相关重要报纸文章 前1条
1 赵莹;抛弃决策模型 使用决策模型[N];中国经营报;2007年
相关博士学位论文 前10条
1 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年
2 彭清艳;广义函数型回归模型及缺失数据模型[D];云南大学;2016年
3 龚奇源;面向数据发布的数据匿名技术研究[D];东南大学;2016年
4 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
5 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
6 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
7 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
8 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年
9 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
10 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
相关硕士学位论文 前10条
1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年
2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年
3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年
4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年
5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年
6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年
7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年
8 汪静波;Logistic回归模型中缺失数据的处理[D];南京大学;2015年
9 朱建斐;数据集缺失数据恢复算法研究[D];西安电子科技大学;2015年
10 母建熊;基于饱和模型的带有缺失的可交换两值数据分析[D];东南大学;2015年
,本文编号:2214532
本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2214532.html