面向电子商务的WEB数据挖掘研究
本文关键词:面向电子商务的WEB数据挖掘研究 出处:《中南大学》2011年硕士论文 论文类型:学位论文
更多相关文章: 电子商务 Web数据挖掘 关联规则分析 模糊聚类分析
【摘要】:随着互联网的迅速发展,互联网上的信息量快速增长。大多数用户无法从庞大的互联网上获得自己想要的信息,很多电子商务网站也无法针对目标用户提供用户感兴趣的内容。当前,在电子商务领域,数据挖掘技术与Web技术正不断融合,利用Web挖掘技术,企业决策者能为用户提供更有效的资源,为企业获得更高的收益。 Web挖掘的研究已经建立了较好的理论体系,也取得了一些应用成果,但是,在针对Web数据的挖掘智能化与站点设计基于商业知识发现的总体规划方面存在较多的问题,还需继续研究。本文是针对这一方面进行一些尝试性的研究工作,主要工作内容如下: 理解了数据挖掘、Web挖掘相关的基本理论和主要技术;研究了在电子商务领域Web数据挖掘的主要应用以及面临的关键问题;具体分析了在电子商务领域数据挖掘的主要内容和数据源;设计了面向电子商务Web数据挖掘总体模型。 详细阐述了基于电子商务Web数据挖掘预处理过程;运用算法描述了数据清洗与净化、用户识别、会话识别和事务识别等过程;研究在电子商务领域运用关联规则技术进行挖掘模式发现,通过实例分析详细探讨了Apriori经典关联规则挖掘算法的具体运用;提出了Apriori算法的不足并对其进行了算法优化;探讨了基于用户浏览兴趣进行用户模糊聚类分析;研究了聚类常用方法,分析了模糊聚类的步骤,研究了用户浏览兴趣的度量及其方法,通过实例分析研究实现了基于用户访问频繁页面次数和耗时的模糊聚类过程。
[Abstract]:With the rapid development of the Internet, the amount of information on the Internet is growing rapidly. Most users can not get the information they want from the huge Internet. At present, in the field of electronic commerce, data mining technology and Web technology are constantly merging, using Web mining technology. Enterprise decision-makers can provide users with more effective resources and obtain higher profits for enterprises. The research of Web mining has established a good theoretical system, and has also made some application results, but. There are many problems in intelligent mining of Web data and overall planning of site design based on business knowledge discovery. This paper is to carry out some tentative research work in this field, the main work is as follows: The basic theory and main technology of data mining related to Web mining are understood. The main applications and key problems of Web data mining in the field of electronic commerce are studied. The main contents and data sources of data mining in the field of electronic commerce are analyzed in detail. A general model of Web data mining oriented to e-commerce is designed. The preprocessing process of data mining based on e-commerce Web is described in detail. The processes of data cleaning and purification, user identification, session identification and transaction identification are described by the algorithm. This paper studies the application of association rules technology to mining patterns in the field of electronic commerce, and discusses the application of Apriori classic association rules mining algorithm in detail through the analysis of examples. The deficiency of Apriori algorithm is put forward and the algorithm is optimized. The user fuzzy clustering analysis based on user's browsing interest is discussed. The common methods of clustering are studied, the steps of fuzzy clustering are analyzed, and the measurement and method of users' browsing interest are studied. The fuzzy clustering process based on the number of frequent page visits and the time consuming is realized through the case study.
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP311.13
【相似文献】
相关期刊论文 前10条
1 席景科;闫大顺;;Web数据挖掘中数据集成问题的研究[J];计算机工程与设计;2006年08期
2 孙鉴亮;;智能型搜索引擎[J];科技咨询导报;2007年15期
3 李仕杨;;数据挖掘技术在Web中的应用问题探讨[J];中国新技术新产品;2009年08期
4 尹海丽,刘慧;用一种数据挖掘的方法解决网络拥挤的问题[J];青岛理工大学学报;2005年05期
5 马秋菊;李小芳;李杰;;基于WEB和数据仓库的商业营销决策支持系统的设计[J];商场现代化;2007年05期
6 赵春燕;;数据挖掘技术及其在高校图书馆的应用[J];北京政法职业学院学报;2007年03期
7 董宇;刘富强;;基于web的数据挖掘系统的研究与设计[J];电子技术;2008年11期
8 周贤善;谢婷婷;;基于Web的数据挖掘在电子商务中的应用[J];孝感学院学报;2010年03期
9 刘忠沁;;Web数据挖掘在高校网站建设中的运用[J];电脑知识与技术;2011年25期
10 彭曙蓉;王耀南;杨文忠;;基于马尔可夫链的Web访问序列挖掘算法[J];计算机工程与设计;2006年02期
相关会议论文 前10条
1 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
2 代广珍;徐超;;基于Web的数据挖掘研究综述[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
4 何英炜;陈志祥;;基于Web的制造企业需求管理系统研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
5 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 王洪肖;刘威;于贺玲;;基于XML技术的WEB数据收集模型的研究[A];低碳经济与科学发展——吉林省第六届科学技术学术年会论文集[C];2010年
8 刘建伟;于守健;乐嘉锦;;基于Web服务资源框架的流数据查询处理系统[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
9 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
10 游争光;刘建勋;唐明董;;分布式Web服务测试系统的设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
相关重要报纸文章 前10条
1 张承东;Web智能考核广告[N];网络世界;2009年
2 赵晓涛;Web安全 服务为王[N];网络世界;2008年
3 本报记者 赵晓涛;Web安全:历史的命题[N];网络世界;2008年
4 彭敏;企业级Web2.0迎来应用高潮[N];电脑商报;2009年
5 本报记者 毛江华;安启华联手赛门铁克 掘金Web安全[N];计算机世界;2009年
6 闫冰;“推”出Web交付新天地[N];网络世界;2009年
7 赵晓涛;中国成全球Web安全新看点[N];网络世界;2009年
8 边歆;动态阻断Web2.0威胁[N];网络世界;2009年
9 泰乐公司首席技术官兼执行副总裁Vikram Saksena;学习Web 3.0 做聪明的“管道工”[N];通信产业报;2009年
10 ;Web2.0工具使用须谨慎[N];网络世界;2009年
相关博士学位论文 前10条
1 陈世展;服务网络:基于语义和社会化关系的Web服务计算基础设施[D];天津大学;2010年
2 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
3 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
4 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
9 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
10 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
相关硕士学位论文 前10条
1 李雪妍;基于Web数据挖掘在个性化远程教学系统中的应用研究[D];电子科技大学;2010年
2 孙学军;面向电子商务的Web数据挖掘应用研究[D];山东大学;2011年
3 周绪倩;基于电子商务的Web数据挖掘系统架构研究[D];河北工程大学;2010年
4 崔广治;Web数据挖掘在个性化服务中的应用研究[D];河北大学;2010年
5 王世云;Web数据挖掘在网上书店个性化推荐系统中的应用研究[D];辽宁工程技术大学;2011年
6 胡峰;Web数据挖掘及其在网络新闻文本数据中的应用[D];电子科技大学;2010年
7 马全明;基于Web日志的数据挖掘研究与实现[D];解放军信息工程大学;2009年
8 王朝阳;基于数据挖掘的自适应Web站点的设计与实现[D];西安电子科技大学;2009年
9 高伟华;基于BP神经网络的WEB数据挖掘[D];中南民族大学;2010年
10 董倩;Web潜在用户挖掘研究[D];河北农业大学;2011年
,本文编号:1360478
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1360478.html