多种数据挖掘技术对于电子商务分类问题研究
本文关键词:多种数据挖掘技术对于电子商务分类问题研究
【摘要】:电子商务行业竞争激烈,数据的价值正日益受到市场的重视。然而,相关统计工具仅提供统计信息、统计模型和假设检验结论,仍缺乏对数据空间的细节认知。而数据挖掘技术正是从数据空间和信息论的角度对数据进行分析,给出宏观与微观的数据结构特征,并利用这些特征帮助对未分类数据进行预测。不同领域的数据具有不同的分布特征,且名义属性、数值属性的分类效率是截然不同的,这使得传统分类器只适用于特定的场合。普适优化的分类器模型需要在克服以上困难的同时,利用尽可能多的信息对一个分类问题进行建模,以统一的方法和流程提供数据空间的特征知识,提升预测性能水平。考虑到电子商务数据集的数据量一般较大,分类器应尽量分散计算负担,以提高训练和预测计算速度。同时,电子商务的数据具有分布式,流量大等特点,其数据需要被有效整合并理解,以促进企业的发展。本文对数据挖掘相关技术进行了分析,指出现有技术存在的不足,如对数据类型,尺度和结构限制较多,且分类模型并非普适,对大型数据运算较慢等。本文描述了产生上述不足的原因,在改进现有挖掘技术的基础上,提出针对电子商务数据分布特点的新模型,并给出实验结果和模型的加速性能,通过和现有模型的对比,论证该模型方案的有效性和优越性,同时,明确相关指标阀值的重要性。
【关键词】:数据挖掘 电子商务 分类模型
【学位授予单位】:复旦大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13
【目录】:
- 摘要5-6
- Abstract6-7
- 第一章 引言7-10
- 1.1 研究背景7-8
- 1.2 本文贡献8-9
- 1.3 本文结构9-10
- 第二章 预备知识及定义10-12
- 2.1 属性分类10
- 2.2 数据预处理10-11
- 2.3 数据分群11-12
- 第三章 数据挖掘算法分析12-30
- 3.1 聚类12-16
- 3.1.1 基于中心聚类12-13
- 3.1.2 基于密度聚类及可视化改进13-15
- 3.1.3 聚类评价指标15-16
- 3.2 非线性分类器16-30
- 3.2.1 决策树16-18
- 3.2.2 神经网络及算法改进18-23
- 3.2.3 神经网络堆叠泛化及算法改进23-24
- 3.2.4 高斯过程24-29
- 3.2.5 预测准确度定义29-30
- 第四章 电子商务分类优化整合模型设计30-43
- 4.1 聚类算法特性分析30-32
- 4.2 非线性分类器特性分析32-34
- 4.3 模型设计方案34-41
- 4.3.1 模型设计思路34-37
- 4.3.2 模型训练37-39
- 4.3.3 模型预测39-41
- 4.3.4 模型准确度定义41
- 4.4 G-KM-NC模型综述41-43
- 第五章 模型性能分析43-63
- 5.1 实验1,互联网广告43-53
- 5.1.1 性能基线44
- 5.1.2 分群44-49
- 5.1.3 分群+聚类49-52
- 5.1.4 加速52
- 5.1.5 小结52-53
- 5.2 实验2,小额信贷审批53-61
- 5.2.1 性能基线55
- 5.2.2 分群55-57
- 5.2.3 分群+聚类57-59
- 5.2.4 加速59-60
- 5.2.5 小结60-61
- 5.3 模型性能综述61-63
- 第六章 总结63-64
- 参考文献64-68
- 致谢68-69
- 硕士期间发表的论文69-70
【相似文献】
中国期刊全文数据库 前10条
1 张红军;谈谈数据挖掘技术及其应用[J];广西梧州师范高等专科学校学报;2003年03期
2 杨雪;浅析数据挖掘技术[J];华南金融电脑;2005年08期
3 李继嵬;刘书明;李春平;;数据挖掘技术在税收预测分析中的应用[J];计算机系统应用;2006年09期
4 刘春明;;数据挖掘技术在金融行业中的应用[J];科技资讯;2006年25期
5 劳飞;朱玉业;;数据挖掘技术在农业中的应用[J];安徽农业科学;2007年13期
6 何树称;罗岚;;数据挖掘技术在客户获取中的应用分析[J];保山师专学报;2007年02期
7 汪楠;成鹰;崔婀娜;;数据挖掘技术怎么用[J];经营与管理;2007年07期
8 马骋;;数据挖掘技术探讨[J];化工之友;2007年17期
9 赵颖;;数据挖掘技术在政府电子政务中的应用[J];软件导刊;2008年11期
10 徐晓伟;;浅谈数据挖掘技术[J];福建电脑;2008年12期
中国重要会议论文全文数据库 前10条
1 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 宁红梅;安志兴;葛亚明;李敬玺;赵坤;钟华;陈俊杰;崔艳红;;数据挖掘技术在兽医学中的应用[A];Proceedings of 2010 National Vocational Education of Communications and Information Technology Conference (2010 NVCIC)[C];2010年
4 王桂芹;黄道;;数据挖掘技术综述[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 徐宝莲;李晓奇;;数据挖掘技术在网络游戏中的应用[A];第十一届中国不确定系统年会、第十五届中国青年信息与管理学者大会论文集[C];2013年
6 胡广芹;陆小左;;数据挖掘技术在中医诊断中的应用[A];中国中西医结合学会诊断专业委员会2009’年会论文集[C];2009年
7 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
8 铁军;吴智明;;数据挖掘技术在工业铝电解生产中的应用[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
9 王建华;王菲;黄国建;;数据挖掘技术研究的现状及展望[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
10 肖健华;吴今培;;数据挖掘技术及其应用实例[A];2001年中国智能自动化会议论文集(下册)[C];2001年
中国重要报纸全文数据库 前10条
1 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
2 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
3 梅静彦;数据挖掘技术在美国银行的应用[N];金融时报;2006年
4 邹广普;数据挖掘技术在保险业中的应用[N];中国保险报;2010年
5 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
6 张崇峰;挖掘,再挖掘[N];中国计算机报;2003年
7 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
8 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
9 刘军 兰小红 龚富强;新技术为老装备“保驾护航”[N];大众科技报;2006年
10 ;软件产业人才培养又辟新路[N];中国高新技术产业导报;2000年
中国博士学位论文全文数据库 前10条
1 姚山;基于数据挖掘技术的造林决策研究[D];北京林业大学;2008年
2 曹秀英;基于粗集的数据挖掘技术及其应用研究[D];哈尔滨工程大学;2003年
3 伍平阳;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[D];南方医科大学;2008年
4 刘刚;数据挖掘技术与分类算法研究[D];中国人民解放军信息工程大学;2004年
5 王勇;时序数据挖掘技术及其在水质预测中的应用研究[D];广东工业大学;2005年
6 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
7 熊忠阳;面向商业智能的并行数据挖掘技术及应用研究[D];重庆大学;2004年
8 朱恒民;领域知识制导的数据挖掘技术及其在中药提取中的应用[D];南京航空航天大学;2006年
9 王萍;基于数据挖掘技术的消费者行为研究[D];吉林大学;2004年
10 白一鸣;基于数据挖掘技术的模糊推理系统设计[D];大连海事大学;2013年
中国硕士学位论文全文数据库 前10条
1 吴辉;数据挖掘技术的研究与应用[D];武汉理工大学;2009年
2 冯璐;基于数据挖掘技术的犯罪规律分析研究[D];青岛大学;2009年
3 郭珉江;数据挖掘技术在疾病诊断相关分组中的应用[D];中南大学;2009年
4 倪泉;基于数据挖掘技术的保险续期催交方法研究[D];华东师范大学;2006年
5 张晨希;数据挖掘技术在股票预测中的应用[D];安徽大学;2006年
6 安建华;数据挖掘技术在零售业中的应用研究[D];东北财经大学;2005年
7 沈捷;数据挖掘技术在银行反洗钱领域中的应用研究[D];浙江大学;2007年
8 贾琳;数据挖掘技术及应用的研究[D];兰州理工大学;2003年
9 许惠君;数据挖掘技术及其在径流预报中的研究与应用[D];华中科技大学;2006年
10 张飒;数据挖掘技术在银行监管工作中的应用[D];吉林大学;2007年
,本文编号:1097380
本文链接:https://www.wllwen.com/jingjilunwen/dianzishangwulunwen/1097380.html