复杂属性环境下的Web错误数据挖掘算法研究
本文选题:web数据 + 距离 ; 参考:《科技通报》2013年10期
【摘要】:Web信息复杂程度不断加深,多维度、高复杂度的信息越来越多,信息中的错误信息特征在海量复杂数据属性中表述越来越困难,造成信息挖掘耗时过长,挖掘效果不好的问题。为了解决这一问题,提出了一种距离信息模糊信息权值分类的Web错误数据挖掘算法。在Web特征表述过程中,运用距离描述Web数据的错误数据特征,运用模糊信息熵,对错误数据特征进行距离分类,保证数据分类的准确性,最大程度的完成错误数据高效挖掘。实验结果表明,该算法能有效减少错误数据信息在海量信息中的挖掘时间,提高了挖掘的准确性,取得了满意的效果。
[Abstract]:The complexity of Web information is getting deeper and deeper, the multi-dimension and high-complexity information is more and more, the error information feature in the information is more and more difficult to express in the massive and complex data attribute, resulting in the problem that the information mining takes too long and the mining effect is not good. In order to solve this problem, a Web error data mining algorithm based on fuzzy information weight classification of distance information is proposed. In the process of Web feature representation, distance is used to describe the error data feature of Web data, and fuzzy information entropy is used to classify the error data feature, so as to ensure the accuracy of data classification and to maximize the efficiency of error data mining. Experimental results show that the algorithm can effectively reduce the mining time of error data in mass information, improve the accuracy of mining, and achieve satisfactory results.
【作者单位】: 呼伦贝尔学院;
【分类号】:TP311.13;TP393.09
【参考文献】
相关期刊论文 前2条
1 张娥,郑斐峰,冯耕中;Web日志数据挖掘的数据预处理方法研究[J];计算机应用研究;2004年02期
2 熊忠阳;周亚峰;;Web访问挖掘的预处理技术的研究[J];计算机技术与发展;2007年08期
【共引文献】
相关期刊论文 前10条
1 吕佳;;Web日志挖掘技术应用研究[J];重庆师范大学学报(自然科学版);2006年04期
2 李甲林;;Web数据挖掘技术研究综述[J];电脑知识与技术;2009年36期
3 任红霞;;基于WEB挖掘的信息处理在开放教育中的应用研究[J];电脑知识与技术;2012年18期
4 谢维奇;翟璐璐;;基于Web日志的远程教育学员网上学习行为的识别[J];福建电脑;2007年02期
5 陈玉哲;王艳君;赵明华;;基于Web日志与定制数据采集相结合的Web使用记录挖掘研究[J];福建电脑;2009年08期
6 倪霓;罗毅;;好友关系型视频推荐系统的实现[J];硅谷;2013年24期
7 张建宏;电子商务网站的数据挖掘[J];湖州职业技术学院学报;2005年01期
8 刘林东,印鉴;Web挖掘在考试系统中应用[J];计算机应用研究;2005年02期
9 裘立波;姜元春;林文龙;;基于关联规则和协同过滤的网络商品捆绑方法研究[J];计算机与现代化;2009年09期
10 王晓燕;何月顺;杨文强;;基于数据挖掘技术的高校教学方法研究[J];科技经济市场;2009年02期
相关会议论文 前2条
1 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 常智荣;马自卫;邓芳;;基于Web日志的数据挖掘技术的研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
相关博士学位论文 前4条
1 刘雪梅;服务器端软件性能分析和诊断方法研究[D];哈尔滨工程大学;2010年
2 徐雪琪;基于统计视角的数据挖掘研究[D];浙江工商大学;2007年
3 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
4 赵洁;基于粒计算的Web使用挖掘研究[D];华南理工大学;2010年
相关硕士学位论文 前10条
1 蔡浩;基于Web使用挖掘的协同过滤推荐算法研究[D];浙江理工大学;2010年
2 相景丽;Web挖掘技术在远程教学系统中的应用[D];电子科技大学;2010年
3 董倩;Web潜在用户挖掘研究[D];河北农业大学;2011年
4 李娟;面向校园网日志分析的web数据挖掘技术研究[D];西安电子科技大学;2010年
5 陈娟;基于JDM的移动互联网用户行为分析[D];武汉理工大学;2011年
6 刘其辉;大众行为下基于贝叶斯网的知识集群模型及其应用[D];华南理工大学;2011年
7 郭东东;政府网站日志挖掘的研究与实践[D];郑州大学;2011年
8 封军;基于WEB日志挖掘的频繁模式挖掘算法研究[D];安徽大学;2011年
9 张旺俊;Web缓存替换策略与预取技术的研究[D];中国科学技术大学;2011年
10 王勇;Web使用挖掘与网页个性化服务推荐研究[D];浙江理工大学;2011年
【二级参考文献】
相关期刊论文 前2条
1 赵伟,何丕廉,陈霞,谢振亮;Web日志挖掘中的数据预处理技术研究[J];计算机应用;2003年05期
2 张娥,郑斐峰,冯耕中;Web日志数据挖掘的数据预处理方法研究[J];计算机应用研究;2004年02期
【相似文献】
相关期刊论文 前10条
1 张贺;蔡江辉;张继福;乔圢;;信息熵度量的离群数据挖掘算法[J];智能系统学报;2010年02期
2 陈小辉;;基于数据挖掘算法的入侵检测方法[J];计算机工程;2010年17期
3 杨舒晴;;连续属性离散化研究[J];电脑知识与技术;2011年02期
4 吴昌钱;;信用分析中常用数据挖掘算法[J];硅谷;2011年06期
5 袁爱香;;C4.5数据挖掘算法的改进及其应用[J];山东农业大学学报(自然科学版);2008年03期
6 颜宏文,马瑞,晏弼成;基于信息熵构造判定树的数据挖掘算法的设计与实现[J];计算机工程与应用;2003年23期
7 温力;利用ASP实现Web数据库信息发布[J];计算机时代;2000年10期
8 张滢;张新卫;;电路实验数据分析挖掘技术研究[J];现代电子技术;2006年24期
9 杨洋;;Web数据挖掘的分析与探讨[J];装备制造技术;2006年05期
10 王懿;;论数据挖掘技术在信息分析中的应用[J];科技情报开发与经济;2009年10期
相关会议论文 前10条
1 颜元;;基于信息熵的旅游地生命周期量化研究——旅游地演化实质的一种假说[A];中国地理学会2006年学术年会论文摘要集[C];2006年
2 谢平;林洪彬;王霄;刘彬;;一种用于故障诊断的多信息熵监测方法研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 闫华;;基于信息熵的粗糙集知识约简方法[A];第十届粤港机电工程技术与应用研讨会暨梁天培教授纪念会文集[C];2008年
4 张孝飞;陈肇雄;黄河燕;俞e,
本文编号:2039606
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2039606.html