当前位置:主页 > 科技论文 > 软件论文 >

大数据下虚假无效数据优化识别仿真

发布时间:2020-03-20 00:42
【摘要】:大数据下对虚假无效数据进行优化识别,可有效过滤虚假信息,提高基础数据的安全性。对虚假无效信息的识别,首先需要获得数据全部类型,并进行规则参数优化,完成对虚假无效信息的优化识别。传统方法将虚假无效数据设定在一个簇内,同时引入信任管理机制来识别节点,但忽略了先将无效数据进行分类,导致识别精度偏低。提出基于聚类规则的大数据下虚假无效数据识别方法。首先对大数据下的运行数据样本进行归一化处理,对虚假无效数据进行聚类,获得虚假无效数据的全部类型,依据识别规则库,选用能够处理高维数据的支持向量数据描述算法进行规则参数优化,采用增减式在线训练算法对虚假无效数据分类器进行不断训练,最终获得较为精确的虚假无效数据识别模型。仿真证明,所提方法能更快速准确地识别出虚假无效数据,有效减少了训练成本。
【图文】:

曲线,数据集,无效数据,曲线


图1在CDM数据集下不同方法的假阳性率曲线图2在CMM数据集下不同方法的假阳性率曲线图3给出3种不同方法在CMM数据集下的运行时间(s)对比结果。图3不同方法虚假无效数据识别运行时间分析图3可知,所提方法进行虚假无效数据识别运行时间短于基于小波变换的识别方法和基于数据挖掘的识别方法,这主要是因为所提方法通过对大数据下的运行数据样本进行归一化处理,采用聚类算法对虚假无效数据进行聚类,同时选用能够处理高维数据、泛化能力强的支持向量数据描述算法进行规则参数优化,从而保障了所提方法进行虚假无效数据识别的时效性。5结束语针对当前方法主要是依据测量数据进行识别,当虚假无效数据类型较为复杂时,不但要增加识别手段,同时还增加了运算量,,降低了虚假无效数据的识别效率。为此,提出一种基于聚类规则的大数据下虚假无效数据识别方法。仿真证明,所提方法能更快速准确地识别出虚假无效数据,有效减少了训练成本。参考文献:[1]谢柏林,等.基于把关人行为的微博虚假信息及早检测方法[J].计算机学报,2016,39(4):730-744.[2]刘华富,刘志雄,黎梨苗.适用于虚假数据过滤的最优传感器覆盖研究[J].计算机应用研究,2016,33(10):3147-3150.[3]李鑫滨,等.基于防伪码鉴定机制的数据伪造攻击检测方法[J].计算机工程,2016,42(8):112-116.[4]丁智国,莫毓昌,杨凡.一种新的在线流数据异常检测方法[J].计算机科学,2016,43(10):63-65.[5]马海峰,等.一种层次式远程数据持有检测方法[J].计算机科学,2017,44(3):55-58.[6]蔡美,刘波.基于蚁群算法的异常数据检测方法[J].计算机工程,2016,42(8):166-169.[7]段大高,等.基于微博评论的虚假消息检测模型[J].计算

曲线,数据集,无效数据,曲线


图1在CDM数据集下不同方法的假阳性率曲线图2在CMM数据集下不同方法的假阳性率曲线图3给出3种不同方法在CMM数据集下的运行时间(s)对比结果。图3不同方法虚假无效数据识别运行时间分析图3可知,所提方法进行虚假无效数据识别运行时间短于基于小波变换的识别方法和基于数据挖掘的识别方法,这主要是因为所提方法通过对大数据下的运行数据样本进行归一化处理,采用聚类算法对虚假无效数据进行聚类,同时选用能够处理高维数据、泛化能力强的支持向量数据描述算法进行规则参数优化,从而保障了所提方法进行虚假无效数据识别的时效性。5结束语针对当前方法主要是依据测量数据进行识别,当虚假无效数据类型较为复杂时,不但要增加识别手段,同时还增加了运算量,降低了虚假无效数据的识别效率。为此,提出一种基于聚类规则的大数据下虚假无效数据识别方法。仿真证明,所提方法能更快速准确地识别出虚假无效数据,有效减少了训练成本。参考文献:[1]谢柏林,等.基于把关人行为的微博虚假信息及早检测方法[J].计算机学报,2016,39(4):730-744.[2]刘华富,刘志雄,黎梨苗.适用于虚假数据过滤的最优传感器覆盖研究[J].计算机应用研究,2016,33(10):3147-3150.[3]李鑫滨,等.基于防伪码鉴定机制的数据伪造攻击检测方法[J].计算机工程,2016,42(8):112-116.[4]丁智国,莫毓昌,杨凡.一种新的在线流数据异常检测方法[J].计算机科学,2016,43(10):63-65.[5]马海峰,等.一种层次式远程数据持有检测方法[J].计算机科学,2017,44(3):55-58.[6]蔡美,刘波.基于蚁群算法的异常数据检测方法[J].计算机工程,2016,42(8):166-169.[7]段大高,等.基于微博评论的虚假消息检测模型[J].计算

【相似文献】

相关期刊论文 前10条

1 赵伟;郭军;;大数据——我该用怎样的战略眼光看待你[J];中国新通信;2014年12期

2 赵建伟;;大数据初探[J];科技资讯;2013年20期

3 桑庆兵;;大数据在高校的应用与思考[J];南通纺织职业技术学院学报;2013年02期

4 张心源;李白杨;;大数据的概念、技术及应用[J];创新科技;2013年09期

5 魏伟;;银行业应对互联网金融挑战的策略初探——基于大数据背景下的思考[J];福建金融;2014年07期

6 王尧;;基于大数据的数据处理方法研究分析[J];数字技术与应用;2014年06期

7 马粮;;数据素质[J];科学时代;2002年15期

8 郭亚军;;大数据时代数字出版服务模式变革研究[J];经济研究导刊;2014年04期

9 谢添;汤浩;;数据大爆炸时代已经到来[J];才智;2013年03期

10 杨超;曹顺良;;基于重叠窗的稀疏评价数据计算方法[J];计算机应用与软件;2010年10期

相关重要报纸文章 前3条

1 [英]维克托·迈尔·舍恩伯格 肯尼思·库克耶 赵纪萍 编译;“大数据”悄然改变世界[N];社会科学报;2013年

2 解明明;用好大数据须强调统计思维[N];中国信息报;2014年

3 中国科学院院士 怀进鹏;大数据对互联网的新挑战[N];中国信息化周报;2013年

相关博士学位论文 前1条

1 赵博;基于大数据的战略预见研究[D];中共中央党校;2016年

相关硕士学位论文 前7条

1 周亮;海量数据的高效近似近邻查询研究[D];大连海事大学;2016年

2 李亚锦;基于相关关系识别的预警算法与应用[D];山东大学;2015年

3 何晓星;中医药个体化诊疗数据挖掘算法的研究与应用[D];清华大学;2006年

4 刘列;北京市高中会考数据挖掘系统设计与实施[D];北京邮电大学;2008年

5 杨峰;基于决策树学习和规则提取的热轧数据分析[D];武汉科技大学;2009年

6 高飒;一般分布区间型符号数据的聚类分析方法研究[D];天津大学;2009年

7 黄显华;转子振动信号特征数据库架构方法研究[D];兰州理工大学;2011年



本文编号:2590971

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2590971.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户61509***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com