营销数据清洗及治理方法的研究及应用
发布时间:2021-09-17 03:29
数据清洗是数据分析的基础,高质量的数据才能分析出更有价值的信息。电力营销业务数据中的免费用电数据,存在非常多的归类标签,如是否有效、有效日期、时间、重复次数、关联用户数、重复类型、年度拆分等,需要采用多种数据处理方法,对数据中的不一致性、缺失值、重复数据进行处理,基于已有字段提取新的信息,得到高质量的数据,才能更精准地支撑建模分析工作。本文就免费电数据进行清洗的流程、技术,以及建模分析应用展开论述。
【文章来源】:信息技术与信息化. 2020,(07)
【文章页数】:4 页
【文章目录】:
0 引言
1 存在的问题
1.1 重复录入
1.2 有效时间重叠
1.3 跨年折算
2 数据概况
3 关键技术
3.1 一致性检查
3.2 缺失值处理
3.3 异常数据
3.4 重复数据
3.5 标准化、正则化
3.6 离散化
4 营销数据清洗
4.1 免费电用户数据清洗
4.2 免费电量年度信息
4.2.1 将免费电量信息按年度拆分
4.2.2 按用户和年份汇总免费电量信息
4.3 核算免费电信息清洗
5 治理方法
5.1 录入信息是否规范
5.1.1 免费电量用户存在多条有效免费电量记录
5.1.2 免费电量用户免费电量值不为10度
5.1.3 同一证件对应多个免费电量用户
5.2 免费电扣减
6 总结
本文编号:3397873
【文章来源】:信息技术与信息化. 2020,(07)
【文章页数】:4 页
【文章目录】:
0 引言
1 存在的问题
1.1 重复录入
1.2 有效时间重叠
1.3 跨年折算
2 数据概况
3 关键技术
3.1 一致性检查
3.2 缺失值处理
3.3 异常数据
3.4 重复数据
3.5 标准化、正则化
3.6 离散化
4 营销数据清洗
4.1 免费电用户数据清洗
4.2 免费电量年度信息
4.2.1 将免费电量信息按年度拆分
4.2.2 按用户和年份汇总免费电量信息
4.3 核算免费电信息清洗
5 治理方法
5.1 录入信息是否规范
5.1.1 免费电量用户存在多条有效免费电量记录
5.1.2 免费电量用户免费电量值不为10度
5.1.3 同一证件对应多个免费电量用户
5.2 免费电扣减
6 总结
本文编号:3397873
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/3397873.html