基于Cookie的数字标签的制作与应用
发布时间:2017-11-12 00:02
本文关键词:基于Cookie的数字标签的制作与应用
更多相关文章: Web 数据挖掘 Cookie Apriori算法 标签
【摘要】:随着社会的信息化发展,互联网越来越受到世界各地的所有类型的用户的欢迎,他们经常登录互联网,在互联网搜索,找到感兴趣的主题和信息,从事一系列的网络互动活动,由于互联网用户数量众多并且复杂,互联网的海量数据和网络处理数据的形式也更加广泛,所以迫切的需要一个强大的数据处理技术的诞生,为了提供更高质量的web服务、web信息挖掘网络信息处理技术的一种重要手段,web挖掘应运而生。在客户机和服务器之间传送信息的数据流,存储大量的潜在的有价值的web日志信息,以此数据来分析网络用户行为和习惯,提高网站的系统性能,为用户提供个性化的服务。本文以京东商城的浏览购物数据包作为本次数据挖掘处理以及分析的数据源,主要从以下几个方面进行了阐述。首先详细介绍了本次研究课题的背景和意义以及国内外研究现状,再次详细概述了数据挖掘与web挖掘的定义,介绍了关联规则算法和Cookie的概念和应用。详细介绍了web挖掘的分类及关键技术。其次重点介绍了web数据自动抽取的过程及方法,在抽取web日志信息时及时抽取cookie所能识别的唯一用户名称。紧接着分析了数据清洗的需求及方法。最后详细介绍了关联规则的理论概念和关联规则挖掘的经典算法-Apriori算法,并且详细介绍了Apriori算法的思想,处理步骤以及算法实施过程,将算法实施在已经处理好的数据中,得出分析结果,为了让挖掘结果更加明晰化,我们根据URL的组成方法,研究了京东商城的网址参数,在得出用户最终行为模式之前,给用户的行为加上标签,让营销决策者以及网站管理者能够更明确的分析各个用户的行为习惯是什么。理解客户的行为和需求是业务领域内一个非常重要的工作。由于电子商务网站的操作不受时间和地理因素的影响,通过一个网站可以收集大量的客户行为数据。数据包含许多会影响网站商业决策用户行为信息。由于大量的数据,手动分析几乎是一个不可能完成的任务。适合处理大量数据的Web数据挖掘技术在这里反映了它的商业价值,它可以帮助企业快速找到和业务决策相关的信息,提高应变能力。
【学位授予单位】:西安工业大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
,
本文编号:1173423
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/1173423.html