随机森林在运营商大数据补全中的应用
本文关键词:随机森林在运营商大数据补全中的应用,由笔耕文化传播整理发布。
【摘要】:电信运营商有大量数据,但是鉴于多种原因,数据的质量不够理想,出现大量数据不完整甚至缺失。对于已有数据的挖掘,必须在数据满足质量要求且达到足够采样比例的前提下开展。依托现有的全国日志留存系统,设计完整数据的模板样库,鉴别不能满足质量要求的数据,使用随机森林算法,找到最符合的相同或相关数据,补全数据并提升数据质量;用回溯反馈的方法优化并扩充模板样库。在全国日志留存系统中构建数据补全子系统,实现端到端的数据质量保障和提升,补全并改善历史数据甚至实时数据的质量,最终满足数据处理和挖掘的要求,提升运营商数据质量和价值。
【作者单位】: 中国电信股份有限公司上海研究院;
【关键词】: 大数据 随机森林 机器学习 数据补全
【分类号】:F626;TP311.13
【正文快照】: 1引言电信运营商是天然的大数据拥有者,拥有着基于用户的信令、上网、位置等多种类型的数据。随着近年大数据技术发展和应用推广,电信运营商也愈发重视数据这一战略资产,研发了多种基于大数据技术的平台和系统,用来收集、存储、处理、开放和应用电信运营商的数据,体现电信运营
【相似文献】
中国期刊全文数据库 前10条
1 刘足华;熊惠霖;;基于随机森林的目标检测与定位[J];计算机工程;2012年13期
2 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期
3 陈姝;彭小宁;;基于粒子滤波和在线随机森林分类的目标跟踪[J];江苏大学学报(自然科学版);2014年02期
4 王丽婷;丁晓青;方驰;;基于随机森林的人脸关键点精确定位方法[J];清华大学学报(自然科学版);2009年04期
5 李建更;高志坤;;随机森林针对小样本数据类权重设置[J];计算机工程与应用;2009年26期
6 吴华芹;;基于训练集划分的随机森林算法[J];科技通报;2013年10期
7 程光;王贵锦;何礼;林行刚;;人体姿势估计中随机森林训练算法的并行化[J];计算机应用研究;2014年05期
8 于延;王建华;;基于云计算平台的随机森林算法的研究与实现[J];科技通报;2013年04期
9 刘永春;宋弘;;基于随机森林的乳腺肿瘤诊断研究[J];电视技术;2014年15期
10 杨帆;林琛;周绮凤;符长虹;罗林开;;基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用[J];系统工程理论与实践;2012年04期
中国重要会议论文全文数据库 前2条
1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年
中国硕士学位论文全文数据库 前10条
1 贺捷;随机森林在文本分类中的应用[D];华南理工大学;2015年
2 张文婷;交通环境下基于改进霍夫森林的目标检测与跟踪[D];华南理工大学;2015年
3 王宇恒;推荐系统中随机森林算法的优化与应用[D];浙江大学;2016年
4 张玉桃;旅客社会网络中的家庭出行预测及其行为特征分析[D];北京交通大学;2016年
5 张兴;基于Spark大数据平台的火电厂节能分析[D];太原理工大学;2016年
6 杨丽;音频场景分析与识别方法研究[D];南京大学;2013年
7 鲁奉军;基于随机森林算法的目标检测与动作识别方法研究[D];吉林大学;2016年
8 吴敏;融合多特征的产品垃圾评论识别[D];福州大学;2012年
9 钟龙申;随机森林算法处理不平衡数据的改进及其并行化[D];广东工业大学;2016年
10 胡太祥;大规模图像标注方法研究[D];华中科技大学;2014年
本文关键词:随机森林在运营商大数据补全中的应用,由笔耕文化传播整理发布。
,本文编号:478210
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/478210.html