当前位置:主页 > 科技论文 > 软件论文 >

随机森林在运营商大数据补全中的应用

发布时间:2017-06-24 13:00

  本文关键词:随机森林在运营商大数据补全中的应用,由笔耕文化传播整理发布。


【摘要】:电信运营商有大量数据,但是鉴于多种原因,数据的质量不够理想,出现大量数据不完整甚至缺失。对于已有数据的挖掘,必须在数据满足质量要求且达到足够采样比例的前提下开展。依托现有的全国日志留存系统,设计完整数据的模板样库,鉴别不能满足质量要求的数据,使用随机森林算法,找到最符合的相同或相关数据,补全数据并提升数据质量;用回溯反馈的方法优化并扩充模板样库。在全国日志留存系统中构建数据补全子系统,实现端到端的数据质量保障和提升,补全并改善历史数据甚至实时数据的质量,最终满足数据处理和挖掘的要求,提升运营商数据质量和价值。
【作者单位】: 中国电信股份有限公司上海研究院;
【关键词】大数据 随机森林 机器学习 数据补全
【分类号】:F626;TP311.13
【正文快照】: 1引言电信运营商是天然的大数据拥有者,拥有着基于用户的信令、上网、位置等多种类型的数据。随着近年大数据技术发展和应用推广,电信运营商也愈发重视数据这一战略资产,研发了多种基于大数据技术的平台和系统,用来收集、存储、处理、开放和应用电信运营商的数据,体现电信运营

【相似文献】

中国期刊全文数据库 前10条

1 刘足华;熊惠霖;;基于随机森林的目标检测与定位[J];计算机工程;2012年13期

2 董师师;黄哲学;;随机森林理论浅析[J];集成技术;2013年01期

3 陈姝;彭小宁;;基于粒子滤波和在线随机森林分类的目标跟踪[J];江苏大学学报(自然科学版);2014年02期

4 王丽婷;丁晓青;方驰;;基于随机森林的人脸关键点精确定位方法[J];清华大学学报(自然科学版);2009年04期

5 李建更;高志坤;;随机森林针对小样本数据类权重设置[J];计算机工程与应用;2009年26期

6 吴华芹;;基于训练集划分的随机森林算法[J];科技通报;2013年10期

7 程光;王贵锦;何礼;林行刚;;人体姿势估计中随机森林训练算法的并行化[J];计算机应用研究;2014年05期

8 于延;王建华;;基于云计算平台的随机森林算法的研究与实现[J];科技通报;2013年04期

9 刘永春;宋弘;;基于随机森林的乳腺肿瘤诊断研究[J];电视技术;2014年15期

10 杨帆;林琛;周绮凤;符长虹;罗林开;;基于随机森林的潜在k近邻算法及其在基因表达数据分类中的应用[J];系统工程理论与实践;2012年04期

中国重要会议论文全文数据库 前2条

1 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年

2 武晓岩;方庆伟;;基因表达数据分析的随机森林方法及算法改进[A];黑龙江省第十次统计科学讨论会论文集[C];2008年

中国硕士学位论文全文数据库 前10条

1 贺捷;随机森林在文本分类中的应用[D];华南理工大学;2015年

2 张文婷;交通环境下基于改进霍夫森林的目标检测与跟踪[D];华南理工大学;2015年

3 王宇恒;推荐系统中随机森林算法的优化与应用[D];浙江大学;2016年

4 张玉桃;旅客社会网络中的家庭出行预测及其行为特征分析[D];北京交通大学;2016年

5 张兴;基于Spark大数据平台的火电厂节能分析[D];太原理工大学;2016年

6 杨丽;音频场景分析与识别方法研究[D];南京大学;2013年

7 鲁奉军;基于随机森林算法的目标检测与动作识别方法研究[D];吉林大学;2016年

8 吴敏;融合多特征的产品垃圾评论识别[D];福州大学;2012年

9 钟龙申;随机森林算法处理不平衡数据的改进及其并行化[D];广东工业大学;2016年

10 胡太祥;大规模图像标注方法研究[D];华中科技大学;2014年


  本文关键词:随机森林在运营商大数据补全中的应用,由笔耕文化传播整理发布。



本文编号:478210

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/478210.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7ded5***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com