当前位置:主页 > 科技论文 > 自动化论文 >

基于先验决策模型的缺失数据谱系树构建方法研究

发布时间:2018-08-31 09:05
【摘要】:谱系树用来表示物种之间的亲缘关系,是生命科学研究的重要内容,而形态学数据是构建古生物谱系树的重要基础。但是,古生物形态学数据常有缺失信息,造成传统谱系树构建算法失效,针对该问题本文提出了基于先验决策模型的缺失数据谱系树构建方法。具体研究内容如下:(1)针对含有缺失数据谱系树构建的问题,提出了基于先验决策模型的谱系树构建方法。首先,利用较完整数据的物种集构建初始谱系树;然后,运用属性约简原理得到决策点,进而建立先验决策模型;最后,根据模型确定缺失数据比例较高的物种在初始谱系树中的位置,通过物种嫁接完成谱系树的构建。实验结果表明,当单个物种缺失数据比例大于10%时,相比最大简约法在平均准确率方面高出10%左右。(2)决策点中属性决策组集合的生成是一个属性组合优化问题,提出了运用遗传算法的属性决策组集合构建方法。该方法结合待约简属性个数与组合类别划分,提出了特有的编码方式、相应的适应度函数和交叉变异方式。进一步提高了缺失数据物种在谱系树中嫁接位置的准确性和稳定性。实验结果表明,本方法所构建的谱系树在物种平均准确率方面相比简单启发式方法最多高出3.4%。(3)为了消除因多次嫁接而产生的并系子树,提出了一种基于权值拟合层次聚类的并系子树预测方法。首先利用最小二乘法对初始谱系树进行属性权值的拟合,进而对并系物种属性进行加权,最后运用有权值层次聚类的方法构建子树。实验结果表明,本方法能够对并系子树进行预测,最终消除了谱系树中的并系子树。
[Abstract]:Pedigree is an important part of life science research, and morphological data is an important basis for constructing paleontology pedigree. However, paleontology data often have missing information, resulting in the failure of traditional pedigree construction algorithm. To solve this problem, this paper proposes a priori decision-making model based on the lack of information. The specific research contents are as follows: (1) To solve the problem of constructing missing data pedigrees, a method of constructing pedigrees based on a prior decision model is proposed. Firstly, the original pedigrees are constructed by using a more complete set of species; then, the decision points are obtained by using attribute reduction principle, and then a prior decision is made. Finally, the position of the species with high missing data proportion in the initial pedigree tree is determined according to the model, and the pedigree tree is constructed by species grafting. The experimental results show that the average accuracy of the attribute decision-making set is about 10% higher than that of the maximum reduction method when the missing data proportion of a single species is greater than 10%. Combining the number of attributes to be reduced with the classification of combinatorial classes, a special encoding method, the corresponding fitness function and the crossover mutation method are proposed, which further improves the grafting of missing data species in the pedigree tree. The experimental results show that the average accuracy of species is up to 3.4% higher than that of the simple heuristic method. (3) In order to eliminate the parallel subtree caused by multiple grafting, a new method based on weight fitting hierarchical clustering is proposed to predict the parallel subtree. The least squares method is used to fit the attribute weights of the initial pedigree tree, and then weights the attributes of the merged species. Finally, a subtree is constructed by using the weighted hierarchical clustering method. The experimental results show that this method can predict the merged subtrees and eliminate the merged subtrees in the pedigree tree.
【学位授予单位】:西北大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:Q11;TP18

【相似文献】

相关期刊论文 前10条

1 金勇进;调查中的数据缺失及处理(Ⅰ)——缺失数据及其影响[J];数理统计与管理;2001年01期

2 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期

3 赵慧秀;马文卿;;带有缺失数据的估计方程[J];曲阜师范大学学报(自然科学版);2009年03期

4 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期

5 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期

6 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期

7 金勇进;缺失数据的偏差校正(系列三)[J];数理统计与管理;2001年04期

8 毕华,李济洪;带有缺失数据的聚类分析方法[J];华北工学院学报;2003年05期

9 李开灿;;有缺失数据的META-MARKOV模型的局部计算[J];应用数学学报;2007年03期

10 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期

相关会议论文 前10条

1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年

2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年

4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年

5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年

6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年

7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年

8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年

9 张敬才;张国伍;;运用模糊数学建立投资决策模型[A];模糊数学和系统成果会论文集[C];1991年

10 黄漫宇;;零售商引入自有品牌的决策模型分析[A];首届中部地区商业经济论坛论文集[C];2007年

相关重要报纸文章 前1条

1 赵莹;抛弃决策模型 使用决策模型[N];中国经营报;2007年

相关博士学位论文 前10条

1 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年

2 彭清艳;广义函数型回归模型及缺失数据模型[D];云南大学;2016年

3 龚奇源;面向数据发布的数据匿名技术研究[D];东南大学;2016年

4 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年

5 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年

6 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年

7 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年

8 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年

9 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年

10 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年

相关硕士学位论文 前10条

1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年

2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年

3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年

4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年

5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年

6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年

7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年

8 汪静波;Logistic回归模型中缺失数据的处理[D];南京大学;2015年

9 朱建斐;数据集缺失数据恢复算法研究[D];西安电子科技大学;2015年

10 母建熊;基于饱和模型的带有缺失的可交换两值数据分析[D];东南大学;2015年



本文编号:2214532

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2214532.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户38675***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com