当前位置:主页 > 科技论文 > 软件论文 >

大数据中用户所需信息资源检测仿真

发布时间:2018-04-23 23:13

  本文选题:大数据 + 用户所需信息 ; 参考:《计算机仿真》2017年11期


【摘要】:通过对数据缺失特征进行检测实现信息资源的有效检测,能够保证大数据中用户所需信息的完整性和准确性,对用户所需信息资源的检测,需要计算出数据特征距离,分析分配缺失数据属性特征权重,完成信息资源的检测。传统方法定义约束容差集合差异度,计算出不完备数据特征集合内全部对象的总体相异程度,但忽略了分析分配缺失数据属性特征权重,导致检测精度偏低。提出基于遗传优化的大数据中用户所需信息资源检测方法。结合遗传优化思想估计用户所需信息均值和协方差矩阵,以用户所需信息的对数似然函数作为目标函数,通过已有缺失数据样本获得参数的相应约束条件,建立大数据中缺失数据估计模型,消除用户所需信息量纲的影响,计算出数据特征的距离,利用聚类分析分配缺失数据属性特征权重,完成大数据中用户所需信息资源检测。实验结果表明,所提方法具有较高的填补准确性,且可扩展性较强。
[Abstract]:By detecting the missing features of the data to realize the effective detection of the information resources, the integrity and accuracy of the information needed by the users in big data can be guaranteed, and the distance of the data features should be calculated for the detection of the information resources needed by the users. Analysis and allocation of missing data attribute feature weights to complete the detection of information resources. The traditional method defines the difference degree of constraint tolerance set, calculates the total difference degree of all objects in the incomplete data feature set, but ignores the analysis and allocation of missing data attribute feature weights, which results in low detection accuracy. Based on genetic optimization, a method of information resource detection for users in big data is proposed. Combined with genetic optimization idea to estimate the average value and covariance matrix of information required by the user, the logarithmic likelihood function of the information required by the user is taken as the objective function, and the corresponding constraint conditions of the parameters are obtained through the existing missing data samples. The missing data estimation model in big data is established to eliminate the influence of the information dimension needed by the user, the distance of the data features is calculated, and the attribute weights of missing data are assigned by cluster analysis, and the information resources needed by the user in big data are detected. The experimental results show that the proposed method has higher filling accuracy and better scalability.
【作者单位】: 江西应用科技学院信息工程学院;
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 张星;郝伟;;不完备或缺失数据及其填补方法研究[J];福建电脑;2007年04期

2 刘星毅;曾春华;江南雨;陈振华;韦小玲;;缺失数据的处理和挑战[J];钦州学院学报;2008年06期

3 杨燕;我国网络信息资源的开发与管理的几点思考[J];图书馆建设;2000年06期

4 金朝阳,徐进;中国互联网络发展现状与图书馆信息资源建设[J];图书馆建设;2002年05期

5 梁 莉;开发信息资源 迎接网络现代化[J];河南机电高等专科学校学报;2002年01期

6 王晓丽;对充分利用图书馆信息资源的思考[J];广西民族学院学报(哲学社会科学版);2004年S2期

7 李琦;;图书馆信息资源的开发与利用[J];山东电大学报;2006年02期

8 葛雪雁;王海斌;;浅析网络信息资源的开发与利用[J];工程建设与设计;2007年06期

9 赵炳武;;评《网络环境下图书馆信息资源的整合开发》[J];中共青岛市委党校(青岛行政学院学报);2007年05期

10 彭凤兰;朱长菊;;略论网络信息资源的整合[J];情报探索;2009年03期

相关会议论文 前10条

1 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年

2 张惠荣;;网络环境下医院图书馆信息资源建设与服务[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年

3 郭峰;;网络环境下图书馆信息资源的共建共享[A];新环境下图书馆建设与发展——第六届中国社区和乡镇图书馆发展战略研讨会征文集(下册)[C];2007年

4 王志红;刘兵;;论图书馆网络信息资源的组织管理[A];向数字化转型的图书馆工作[C];2004年

5 杨姝;;网络环境下图书馆信息资源的开发利用[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年

6 李晓红;;浅谈我国信息资源建设政策的制定及实施[A];全国高校社科信息资料研究会第六次会员代表大会暨第13次学术研讨会论文集[C];2010年

7 王俊俐;;对图书馆信息资源科学化建设和管理的若干思考[A];信息时代——科技情报研究学术论文集(第二辑)[C];2006年

8 郭光友;曾令涛;吕小定;唐清安;;教学多媒体信息资源表征及应用研究[A];中国电化教育协会2002年年会论文集[C];2002年

9 刘乐群;;我院图书馆信息资源建设的现状及对策[A];陕西省图书馆学会第五次会员代表大会暨学术研讨会与全国图书馆部室主任工作、学术研讨会论文集[C];2003年

10 段玮弘;王宝英;;我国互联网的发展现状及其对图书馆的影响[A];山西省科学技术情报学会学术年会论文集[C];2004年

相关重要报纸文章 前3条

1 北京市新闻出版局 李超;数字出版再认识[N];中国新闻出版报;2013年

2 陈玉龙;信息资源开发利用的基本框架[N];计算机世界;2007年

3 陶颖;利用图书馆资源优势 构建区域经济信息中心[N];黑龙江经济报;2006年

相关博士学位论文 前3条

1 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年

2 龚奇源;面向数据发布的数据匿名技术研究[D];东南大学;2016年

3 李后卿;我国网络信息资源区域配置中的数字鸿沟研究[D];中南大学;2009年

相关硕士学位论文 前10条

1 朱建斐;数据集缺失数据恢复算法研究[D];西安电子科技大学;2015年

2 姜瑶;基于缺失数据的系统辨识方法研究及相关软件设计与实现[D];东南大学;2016年

3 陈慧佳;基于Random Forest的缺失数据补全策略研究[D];南昌大学;2016年

4 张赤;基于聚类分析的缺失数据填补算法研究[D];武汉轻工大学;2013年

5 沈雪;基于贝叶斯方法的缺失数据补全研究[D];重庆大学;2011年

6 于会萍;网络环境下图书馆信息资源管理系统设计[D];河北大学;2005年

7 魏佳;我国网络信息资源永久保存策略研究[D];辽宁师范大学;2012年

8 姜玉晶;网络环境下图书馆数字海洋信息资源的组织与服务创新研究[D];山东大学;2010年

9 杨贺;基于Active Learning的数据修复补全策略研究[D];南昌大学;2014年

10 周莉;网络信息资源知识组织与揭示研究[D];东北师范大学;2006年



本文编号:1794068

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1794068.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c95db***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com