基于多规则的数据修复方法
发布时间:2022-01-15 10:08
随着计算机技术的不断发展和大数据时代的到来,数据质量的提升也逐渐受到重视,数据质量由数据一致性和准确性等决定,数据质量直接决定了数据处理和数据分析等基于数据的操作和以此为依据所得到的研究结论,比如针对工业数据中的用户分析,数据本身的准确性以及用户与数据的对应关系的准确性是数据分析的基础,如果不能保证数据的准确,数据分析并不能得到相应的可信结论。在商业社会中,数据质量也直接或间接的影响着工业化的效益,定期维护数据库中的数据,有利于保持较高的数据质量。本文是在SSG公司的数据集上进行的研究,考虑数据集特定列reference结构的复杂性和数据的特征,推而广之,对于关系型数据库中此类型数据的数据修复进行讨论。基于传统的基于规则的数据修复方法的思路下,将函数依赖关系中对数据库的结构设计的应用拓展到条件函数依赖关系对数据元组的规则约束,两者结合构建规则集合,提升数据修复效果的前提下,也大大提升了修复的速率,是基于实际应用的修复策略的方案。同时基于机器学习对空值的修复,对于上述修复规则中对数据修复过程无法修复修复空值的问题,结合依赖关系给出了完整的修复方案。本文主要工作如下:1)针对数据修复问题,...
【文章来源】:东华大学上海市 211工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
ANN模型
全连接神经网络依据拓扑结构对神经网络进行划分,两层、三层和多层神经网络体现了网络
三层神经网络神经网络的几何意义是如果将训练样本集中的观测当作n个输入变量上的
本文编号:3590431
【文章来源】:东华大学上海市 211工程院校 教育部直属院校
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
ANN模型
全连接神经网络依据拓扑结构对神经网络进行划分,两层、三层和多层神经网络体现了网络
三层神经网络神经网络的几何意义是如果将训练样本集中的观测当作n个输入变量上的
本文编号:3590431
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3590431.html