电子商务环境中异常数据应用研究
本文关键词:电子商务环境中异常数据应用研究,由笔耕文化传播整理发布。
【摘要】:异常检测作为数据挖掘的重要部分,其应用不已仅仅是数据采集方面,在科学研究、股票、金融、保险、电信和Internet等领域都有广泛的应用。网络和电子商务的飞速发展,使得电子商务企业积累了大量的客户资料,电子商务企业迫切需要从大量的数据中挖掘出企业急需的知识和信息,异常数据就是其中重要的一部分,对这些异常数据不够重视或者视为错误来处理,很可能会遗漏很多重要的信息,这些异常数据往往能为企业带来大量的利润。本文围绕电子商务环境下异常检测的关键技术展开,主要论述异常检测在电子商务领域的应用,并以B公司为实例进行实证研究,进行电子商务环境下异常检测在客户关系管理中的应用研究。主要包括以下几点: 1.对异常检测的相关理论进行了详细的分析。本文对异常值、异常检测进行了概念界定,并对异常检测定义和相关算法的国内外研究现状进行了归纳和总结,在比较各种算法的优点和缺点后,最后选取基于距离的异常检测算法作为本文实证部分的算法。 2.构建了B网络搜索公司的异常客户检测指标体系。设置了15个指标从过去价值、当前价值、潜在价值、行为日志数据、推广方案数据几个的方面反映客户信息,,应用因子分析法从指标体系中筛选出影响客户综合得分的最重要的六个指标,这六个指标也是影响客户异常的最重要指标。在分析异常客户出现异常原因的时候,结合实际证明本研究得到的这六个指标的解释力足够。 3.选取了基于距离的异常检测算法和因子分析法进行实证分析。依据设计好的指标体系,对B司的50个客户进行基于距离的异常检测,得到02、21、23和29四个异常客户。应用拉依达准则对客户主因子综合得分进行异常判定,所得结果与基于距离的异常检测算法进行对照,发现有21和23两个客户是相同的,而其他客户结果不一致。 4.针对各个异常客户进行甄别和异常原因的分析,并制定相应的管理和营销策略。对基于距离的异常检测算法和因子分析法挖掘出的两个异常客户,结合实际情况进行分析,找出导致异常的原因,根据这些原因制定相应的应对策略。对于两种算法不一致的02、29个客户,最后判定为异常客户,确定基于距离的异常检测解释力更强。同时,对得到主因子综合得分较高的20、24客户和综合得分最低的14、16客户进行分析,经过分析证明这四个客户不是异常客户,同时也给出了一些管理建议。
【关键词】:电子商务 数据挖掘 异常检测 因子分析
【学位授予单位】:兰州交通大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13
【目录】:
- 摘要4-5
- Abstract5-9
- 1 绪论9-13
- 1.1 背景与意义9-11
- 1.1.1 背景9-10
- 1.1.2 电子商务环境下异常数据研究的意义10-11
- 1.2 论文的主要工作11-12
- 1.3 本文的章节设置12-13
- 2 异常检测概述13-18
- 2.1 异常检测的概念界定13-14
- 2.2 产生异常数据的原因14-15
- 2.3 异常检测的电子商务应用15-18
- 2.3.1 异常检测在证券股票分析中的运用15-16
- 2.3.2 异常检测在电子商务欺诈中的运用16
- 2.3.3 异常检测在客户关系管理中的运用16-18
- 3 异常检测算法研究综述18-23
- 3.1 异常检测建模方法18-19
- 3.1.1 对样本集都进行建模18
- 3.1.2 不依赖先验知识的建模方法18-19
- 3.1.3 依赖先验知识的建模方法19
- 3.2 异常检测算法19-23
- 3.2.1 基于统计学原理的异常检测算法19-20
- 3.2.2 基于密度的异常检测算法20-21
- 3.2.3 基于距离的异常检测算法21-22
- 3.2.4 基于聚类的异常检测算法22
- 3.2.5 基于人工神经网络模型的异常检测算法22-23
- 4 电子商务环境中算法的选择与指标设置23-31
- 4.1 异常检测算法的选择23-24
- 4.2 基于距离的异常检测算法简介24-26
- 4.2.1 距离的度量24-25
- 4.2.2 基于距离的异常检测算法的种类及描述25-26
- 4.3 拉依达准则(3σ准则)26-27
- 4.4 电子商务环境下异常检测指标体系的设计27-31
- 5 实证研究31-53
- 5.1 企业背景介绍31-32
- 5.2 采用基于距离的异常检测算法的客户关系管理应用过程32-34
- 5.3 计算分析34-38
- 5.4 因子分析38-47
- 5.5 结果分析47-53
- 6 总结与展望53-54
- 6.1 总结53
- 6.2 展望和不足53-54
- 致谢54-55
- 参考文献55-58
- 附录 A 客户数据58-61
- 攻读学位期间的研究成果61
【共引文献】
中国期刊全文数据库 前10条
1 范进;;产业结构对产业集群影响力的实证分析[J];安徽广播电视大学学报;2006年04期
2 于立红;杜芸;;数据挖掘中数据预处理方法与技术[J];安徽电子信息职业技术学院学报;2009年04期
3 舒坚;郑诚;陈振;;基于关联分类方法的Web使用挖掘研究[J];安徽大学学报(自然科学版);2006年02期
4 唐超礼;魏圆圆;;基于数据挖掘的植保预测系统[J];安徽农业科学;2008年12期
5 刘秋生;吴小倩;;基于数据挖掘的固定资产投资效益评价[J];安徽农业科学;2011年11期
6 张友志;钱萌;程玉胜;;基于关联规则web日志挖掘方法的研究[J];安庆师范学院学报(自然科学版);2006年01期
7 吴焕瑞,张红霞;数据库技术的新发展与新特点[J];保定师范专科学校学报;2004年02期
8 高洪歌;赵会群;;关联规则挖掘在乒乓球比赛技战术分析中的应用[J];北方工业大学学报;2006年01期
9 贺巍巍;郑力;高本河;;供应商选择多层次熵权综合评价法研究[J];北京交通大学学报(社会科学版);2007年03期
10 李燕琴;一种生态旅游者的识别与细分方法——以北京市百花山自然保护区为例[J];北京大学学报(自然科学版);2005年06期
中国重要会议论文全文数据库 前10条
1 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
2 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
3 杨雯怡;郑康锋;杨义先;;一种自适应的网络安全防护方案[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
4 张宇;;基于XML的Web数据自动挖掘[A];科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C];2008年
5 张秋彤;;数据挖掘与高校图书馆个性化信息服务[A];第九届中国不确定系统年会、第五届中国智能计算大会、第十三届中国青年信息与管理学者大会论文集[C];2011年
6 丁信宙;仇环;苏晓庆;;基于云理论的缺损数据推理和预测[A];山东省测绘学术年会论文集[C];2006年
7 丁琳琳;孟军;;猪肉价格风险预警模型的建立与应用[A];畜牧业环境、生态、安全生产与管理——2010年家畜环境与生态学术研讨会论文集[C];2010年
8 张艳;周国祥;;Web挖掘在个性化信息检索中的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
9 单科华;李郴;习颖慧;王飞;;煤炭企业投资决策系统的分析与研究[A];第18届全国煤矿自动化与信息化学术会议论文集[C];2008年
10 李林博;付忠广;;基于决策树和模糊逻辑的转子振动故障诊断系统[A];第十二届全国设备故障诊断学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
2 祁瑞华;不完整数据分类知识发现算法研究[D];大连理工大学;2011年
3 郜峦;基于文献分析的“肺与大肠相表里”证治规律及其关系研究[D];北京中医药大学;2011年
4 卢又燃;放射科随访数据库建立与粗糙集方法辅助诊断胶质瘤分级的应用分析[D];复旦大学;2009年
5 金海浩;五行相生间接补法古代应用规律研究[D];南京中医药大学;2011年
6 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
7 韩建光;企业财务困境预测动态建模研究[D];哈尔滨工业大学;2011年
8 雷震;随机森林及其在遥感影像处理中应用研究[D];上海交通大学;2012年
9 刘丹红;各类疾病住院患者危重度分级研究[D];中国人民解放军第四军医大学;2003年
10 周海燕;空间数据挖掘的研究[D];中国人民解放军信息工程大学;2003年
中国硕士学位论文全文数据库 前10条
1 王本超;基于KPCA与SVM的人脸识别研究[D];大连理工大学;2010年
2 张进;我国施工劳动生产率管理研究[D];大连理工大学;2010年
3 刘美玲;基于综合策略支持向量机的孤立点检测技术[D];大连理工大学;2010年
4 李仁良;决策树算法在临床诊断中的应用研究[D];辽宁工程技术大学;2009年
5 刘芳;改进的蚁群聚类算法在森林火灾预测中的应用研究[D];辽宁工程技术大学;2009年
6 刘晓英;知识关联及其应用研究[D];湘潭大学;2010年
7 刘巍;基于聚类的孤立点发现技术研究及其在审计中的应用[D];中国海洋大学;2010年
8 韩成勇;高校学评教决策支持系统设计与实现[D];苏州大学;2010年
9 方少卿;Web就业信息抽取系统的实现研究[D];合肥工业大学;2010年
10 年爱华;数据挖掘在职校普通话等级考试成绩分析中的应用[D];兰州大学;2010年
本文关键词:电子商务环境中异常数据应用研究,由笔耕文化传播整理发布。
本文编号:452257
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/452257.html