面向电子商务的客户关系管理数据挖掘模型研究
本文关键词:面向电子商务的客户关系管理数据挖掘模型研究,,由笔耕文化传播整理发布。
Industrial Engineering and Management 4 ,2004 No.
工业工程与管理 2004 年第 4 期
收稿日期 :2003 - 10 - 08 ;
基金项目 : 国家自然科学基金资助项目 (70271031)
作者简介 : 张曙红 (1974 -
) ,男 ,华中科技大学管理学院博士后 ,研究方向 : 数据挖掘及电子商务 、 系统预测与决策 。
文章编号 :100725429 ( 2004) 0420078205
example was presented.
面向电子商务的客户关系管理数据挖掘模型研究
张曙红1 ,2 , 张金隆1 , 陈德军
( 1. 华中科技大学 管理学院 ,湖北 武汉 430074 ; 2. 中国地质大学 管理学院 , 湖北 武汉 430074)
摘要 : 客户资源是企业竞争力的归宿 , 客户关系需要进行科学管理 , 这已成为现代企业的共 识。 电子化的客户关系管理要求企业建立客户资源数据库 ,并基于客户资源数据库通过网络实现客 户需求分析 、 挖掘客户资源 、 实现个性化客户服务等 。 本文对支持向量机理论进行了研究 , 在介绍 SVM 原理的基础上 ,给出了基于支持向量机理论的高维空间数据挖掘方法 , 并结合实例研究给出 了面向电子商务的智能客户关系管理模型 。 关键词 : 电子商务 ; 客户关系管理 ; 数据挖掘 ; 支持向量机 中图分类号 : F713. 36 文献标识码 : A
The Data Mining Model of CRM Oriented to Electronic Business
ZHAN G Shu2hong1 ,2 , ZHAN G J in2long1 , CHEN De2jun1
( 1. School of Management , Huazhong University of Science and Technology , Wuhan 430074 , China ; 2. College of Management , China University of Geosciences , Wuhan 430074 , China) Abstract : It is t he common opinion t hat t he customer relationship should be managed scientifically in t he modern enterprises. In t he elect ronic customer relationship management ( CRM) , t he customer resource database should be established , t he customer demand analysis , data mining of customer resource database and characteristic service can be carried out via t he network. In t his paper , support vector machines ( SVM) and t he data mining met hod based on SVM of high dimension space are st udied , t hen t he intelligent CRM model oriented to elect ronic business combined wit h a simulation Key words : elect ronic business ; CRM ; data mining ; support vector machines
1
引言
客户关系管理 ( CRM) 是指对企业和客户之间 的交互活动进行管理 。 客户关系管理的一个重要目 标是找到现有的和高利润的潜在客户 , 然后策划和 实施促销活动以影响客户的行为 。 随着 Internet 的 快速发展 ,如今大量的企业正迅速面向全球性商务 , 用电子方式把遍布全球的客户和供应商紧密联系起 来。 因此电子商务时代客户关系管理研究的重要性 已经被越来越多的企业所认同 。 由 Internet 的开放性所决定 , 电子商务网站会
修回日期 :2004 - 01 - 10
得到大量原始数据 。 通过在 Web 上应用各种信息分 析技术 ,企业可以根据这些信息分析来预测客户行 为 ,做到针对不同顾客提供个性化服务 。 同时 , 利用 有效的顾客信息 ,还可以大大降低企业的运营成本 。 在当前的信息分析技术中 , 数据挖掘技术是最具有 应用前景的一种技术 。 在客户关系管理中 ,数据挖掘 的主要功能是能自动地从客户信息数据仓库中找出 潜在的客户购买行为模式 ,进而预测客户行为 ,并对 各类顾客采取相应的营销策略 。 在数据挖掘理论方法中支持向量机理论是一种 基于统计学习理论的有效的信息建模和预测数据挖
— 78
—
Industrial Engineering and Management 4 ,2004 No.
工业工程与管理 2004 年第 4 期
掘算法 。 这一新的理论方法在解决模式识别中小样 本、 非线性及高维数据识别问题中表现出独特的优 势 ,近年来得到了广泛的应用 。 本文对支持向量机理 论进行了研究 ,并将支持向量机数据挖掘理论应用 于电子商务的客户关系管理中 , 通过对一定量客户 的信息资料进行分析 ,来发现顾客的购买模式 ,从而 为客户提供针对性和个性化的服务 。
L ( w , b , a) =
1 ( w ?w ) 2
k
i =1
∑a { y [ ( w ?x )
i i i
- b] - 1} ( 3)
上式要求对 w , b 极小化 , 对 a 极大化 , 即 :
max W ( a) = max{ min L ( w , b , a) }
a a w,b
根据约束优化理论中的 Kuhn Tucker ( KT) 条
k k
件[4 ] , 有
2
SVM 原理
支持向量机 ( SVM) 是基于 VC (Vapnik2Chervone2
i =1
∑a y
i i
= 0, w =
i =1
∑a y x
i i
i
, 可得该极值优
化问题的对偶形式 :
max W ( a) = 1 a a y y ( x ?x j ) + 2 i , j =1 i j i j i
k k
nkis) 理论的机器学习方法。 支持向量机算法的思想来
∑
i =1
∑a
i
( 4)
自于统计学习理论 ,是由 Vapnick 和他在 AT &T 实验室 的合作者提出的[1- 2 ] 。 该算法基于结构风险最小化原 理 ,将原始数据集合压缩到支持向量集合 ,然后用子集 学习得到新知识 ,同时也给出由这些支持向量决定的 规则。 SVM 分类模型的基本思想是构造一个超平面作 为决策平面 ,使正负模式之间的距离最大。 下面简要介 绍一下支持向量机分类模型。
s . t . : a i ≥0 , i = 1 , 2 , …, k
k
i =1
∑a y
i i
= 0
根据 KT 条件 , 这个不等式约束下的极值优化 问题 , 存 在 惟 一 解 。参 数 w , b 的 值 可 由 等 式
a i [ y i ( w ?x i - b) - 1 ] = 0 , i = 1 , 2 , …, n 求出 。
相应的分类函数可化为 :
k
2. 1
最优分类平面 [ 3 ]
f ( x ) = sign [
支持向量机方法是统计学习理论基本思想的实 现。 考虑最简单的二值线性可分情况 ,在二维分类的 情况下 ,最优分类面简化成最优分类直线 。 最优分类 面不仅要保证将两类样本无错误地分开 , 还要求分 类间隔最大 。 设线性可分的样本集有 k 个样本 ( x i , y i ) , 其中
i = 1 , 2 , …, k , x i ∈ R , y ∈{ - 1 , 1} 是类别标号 。
d
i =1
∑a y ( x ?x )
i i i
+ b]
( 5)
远离决策面的输入样本所对应的 ai 必定为 0 , 而非 0 的 ai 对应的样本完全确定了决策面 , 因此称 为支持向量 。 分类函数由支持向量惟一确定 。 对于非线性可分的情况 , 可使用一个非线性核 函数 < ( x ) , 把数据映射到一个高维特征空间 , 再在 高维特征空间建立优化超平面 。 设相应的超平面为 :
w ?< ( x ) + b = 0 , 则分类函数变为 :
k
对于二值分类问题 , 在高维空间中可以找到一个将 两类样本无错误分开的分类超平面满足 g ( x ) = w ?x - b = 0 , 即 : ( w ?x ) + b = 0 , w ∈ R d , b ∈ R , 则对应的分类函数为
[2 ]
f ( x ) = si gn [
i =1
:
目前 , 关于核函数的研究也成为了支持向量机 方法研究领域的一个重要课题 。
f ( x ) = si gn ( ( w ?x ) + b)
( 1)
2. 2
SVM 在多类别数据分类中的应用
考虑到两类样本离决策面都应有一定的距离 , 设所有样本被无错误的分开时 , 决策面的约束应满 足:
y i ( w ?x i - b) - 1 ≥0 ( 2)
基本的支持向量机是针对二值的分类问题 ,为实
现对多个类别的识别 ,需对 SVM 进行推广。 SVM 由于
基于二值分类 ,可以把它和二叉决策树的基本思想结
合起来构成多类别数据的分类器 , 称这种方法为
SVM 决策树方法[5 ] 。 决策树方法需构造若干个 SVM
在高维特征空间中 , 可以计算 H1 和 H2 之间的
2 。 最佳决策面应满足两 ‖w ‖ 类样本到决策面的最小距离为最大 , 就是使 φ( w )
距离 d ( w , b , x ) =
分类器。 根据二叉树的定义 , 构造一棵有多个叶子结 点的严格二叉树有多种不同方案。 SVM 决策树方法 的具体实现方案通常有如下两种二叉树结构 ,如图 1 所示。 SVM 决策树方法中 ,决策树具有层次结构 , 在 训练集合的构成也不同 ;决策树各结点和树叶的划分 一般没有理论指导 ,需一定的先验知识。 — 79 —
1 1 T 1 2 ( w ?w ) 最小 。 = ‖w ‖ = w w = 这样 , 2 2 2 分类问题变成 ( 2) 式约束下的最小值优化问题 。 这
每个层次子 SVM 分类器的级别和重要性不相同 , 其
个带有约束的优化问题可以通过引入拉格朗日乘子
a i ≥0 , i = 1 , 2 , …, k 来求解 , 即 :
∑a y <( x ) ?<( x )
i i i
+ b]
( 6)
张曙红 ,等 : 面向电子商务的客户关系管理数据挖掘模型研究
研究 。 为了简明起见 , 设在汽车销售中 , 只将汽车分 类为高档和低档 。 如果还要将中档汽车加以分类 ,可 以进一步应用 SVM 二叉决策树模型分类 。 经过调查 咨询 ,在汽车电子商务活动中影响客户购买私人汽 车档次的主要因素有 : 家庭收入 、 客户受教育程度 、 年龄 、 子女个数 、 家庭住房条件等 。 现在根据以上 5 个主要指标的客户统计数据 , 基于支持向量机理论 对客户购买高档 、 低档汽车的倾向进行预测分析 。 表
1 为汽车电子商务系统中客户信息数据库记录的部
图1
SVM 二叉决策树结构
3
面向电子商务的客户关系管理数 据挖掘模型
电子商务下的客户关系管理要求企业建立客户
分典型客户买车情况调查信息表 。 应用支持向量机理论进行数据挖掘之前需要必 要的数据预处理。 对于学历的量化经过统计调查分析 认为将本科、 硕士、 博士、 博士后分别量化为 1 ,2 ,3 , 3. 6 比较合理。 数据预处理首先应对属性值进行归一 化:
xi = xi max ( x i )
信息数据库 ,并基于客户信息数据库通过网络实现 客户的服务管理 、 客户需求分析 、 实现个性化客户服 务等 。 当前 ,数据挖掘方法在电子商务的客户关系管 理中得到了广泛的应用 。 基于统计学理论的支持向 量机理论在数据挖掘中具有广阔的发展前景 。 图 2 为面向电子商务的智能客户关系管理数据 挖掘系统结构模型 。 在该模型中 ,基于支持向量机理 论的数据挖掘方法得到了应用 。 在图 2 的客户关系 管理模型中 ,客户经过客户注册或身份验证后与客 户服务与管理系统 Web server 保持联结 。 Web 在
server 中 , 客户的注册信息被加入客户信息数据库
归一化后的属性值 x i ∈ [ 0 , 1 ] 。 令高档汽车用
y = + 1 标识 ; 低档汽车用 y = - 1 标识 。 这样问题就
抽象为属性集 A 到分类集 C 的映射 :A ×C →[ 0 ,1 ] ×{ + 1 , - 1} 。 将表 1 中的 15 个客户记录进行归一化后作为支 持向量 ,应用支持向量机模型进行数据挖掘分析。 本 实例取普通的内积函数为核函数 ,并采用 Matlab 编程 计算。 2 为各个支持向量的对应的序号和 a 值。 表 经 过 Matlab 编程计算得到 :ω = [ 0 . 3081 0 . 3620 0 . 4076
- 0 . 4663
中 ,并且部分客户数据被作为建立支持向量机数据 挖掘模型的数据基础 。 新的客户信息数据在经过预 处理后 ,根据支持向量机数据挖掘模型进行客户的 偏好及个性分析 。 电子商务系统将根据客户个性预 测结果通过交互式网页和电子邮件服务两种形式跟 客户联系 ,对顾客进行针对性的跟踪服务 。 下面以某汽车销售电子商务系统对特定客户购 买私人汽车档次的预测分析为例 , 对上述基于支持 向量机理论的智能客户关系管理数据挖掘模型进行
0 . 2671 ] ; b = - 2 . 0846 。
支持向量机数据挖掘模型可以根据客户信息来 预测客户的购买倾向 ,将符合客户要求档次的车型 、 价格及款式等信息通过交互式网页反馈给客户 。 大 量详细的信息还可以通过电子邮件进行跟踪推荐 。 如取一新客户信息数据 ( 家庭收入 、 教育程度 、 、 年龄 子女个数 、 家庭住房条件 ) 为 :11000 、 硕士 、 、、 35 1
140 , 经 过 数 据 处 理 后 为 : [ 0. 7333 0. 7778 0. 5 0. 5556 0. 7778 ] 。 利用支持向量机分类函数
式 ( 5) 可得到分类函数的输出值为 + 1 ,即预测客户 倾向于购买高档汽车 。 同理 , 若一新客户信息值为 : 5000 、 本科 、 、、 , 经过数据处理后为 : [ 0. 3333 40 1 90 0. 2778 0. 8889 0. 5 0. 5000 ] , 利用支 持 向 量 机预测模型 ,分类函数输出值为 - 1 , 即可预测此客 户购买低档汽车的可能性比较大 。 应用 FCM ( C = 2) 聚类算法 [ 6 ] 对表 2 中的数据
图2 智能客户关系管理数据挖掘系统结构
进行聚类分析 , 得到聚类结果为 : {1 ,2 ,6 ,7 ,9 ,13 , 14} ,{3 ,4 ,5 ,8 ,10 ,11 ,12 ,15} 。 这与应用支持向量机
— 80
—
Industrial Engineering and Management 4 ,2004 No.
工业工程与管理 2004 年第 4 期
分类方法得到的分类结果是一致的 。 应用支持向量 机方法 ,在选取合适的分类面的情况下可以得到很
表1 支持向量序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
好的分类效果 ,而且支持向量机方法与许多分类方 法相比 ,还有对各属性权重不敏感的优点 。
年龄
35 34 38 45 39 40 45 45 40 35 38 30 32 34 35
客户买车情况调查信息表 子女个数
0 1 1 1 1 2 1 1 1 0 1 0 1 1 1
家庭收入 ( 元)
6000 8000 9000 10000 15000 9000 7000 12000 7000 8000 13000 8000 8500 6500 9500
教育程度 本科 硕士 博士 硕士 博士后 本科 本科 博士 硕士 硕士 本科 硕士 博士 硕士 博士后 表2
住房条件 ( m2 )
80 120 150 140 135 110 100 180 110 120 140 130 120 110 135
买车档次 低档 低档 高档 高档 高档 低档 低档 高档 低档 高档 高档 高档 低档 低档 高挡
客户信息支持向量及其 a 值 年龄
0. 7778 0. 7556 0. 8444 0. 8222 0. 8667 0. 8889 1 1 0. 8889 0. 7778 0. 6667 0. 7111 0. 7556 0. 7778 0. 6667
支持向量序号
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
家庭收入
0. 4000 0. 5333 0. 6000 0. 6667 1 0. 6000 0. 4667 0. 8000 0. 4667 0. 5333 0. 8667 0. 5333 0. 5667 0. 4333 0. 6333
教育程度
0. 2778 0. 5556 0. 8333 0. 5556 1 0. 2778 0. 2778 0. 8333 0. 5556 0. 5556 0. 2778 0. 5556 0. 8333 0. 5556 1
子女个数
0 0. 5 0. 5 0. 5 0. 5 1 0. 5 0. 5 0. 5 0 0. 5 0 0. 5 0. 5 0. 5
住房条件
0. 4444 0. 6667 0. 8333 0. 7778 0. 7500 0. 6111 0. 5556 1 0. 6111 0. 6667 0. 7778 0. 7222 0. 6667 0. 6111 0. 7500
买车档次
- 1 - 1 1 1 1 - 1 - 1 1 - 1 1 1 1 - 1 - 1 1
a值
0. 6104 0. 3681 0. 2525 0. 2885 0. 2059 0. 3124 0. 4112 0. 1943 0. 3681 0. 4471 0. 3161 0. 4622 0. 2857 0. 4055 0. 2734
— 81
—
张曙红 ,等 : 面向电子商务的客户关系管理数据挖掘模型研究
York : Springer Press ,1995. [ 2 ] Burge C J C. A tutorial on support vector machines for pattern recognition[J ] . Data Ming and Knowledge Discovery , 1998 , 2 : 121 - 167. [ 3 ] 建新 ,段汕 ,潘继斌 ,等 . 支持向量机在小样本识别中的应用 [J ] .
4
小结
电子商务的出现 , 给客户关系管理的应用提供 了更为有效的 、 灵活的 、 广阔的发展空间 , 电子商务 逐渐成为企业市场销售和客户关系管理的一个重要 渠道 。 电子商务网站每天都产生大量的数据 ,这些数 据中包含很多对企业非常有用的客户信息 。 在电子 商务中将数据挖掘技术与客户关系管理 ( CRM) 相 结合 ,可以将市场 、 、 销售 服务协同起来 ,为企业带来 更大的经济效益 。 基于统计学理论的支持向量机数 据挖掘方法在客户关系管理中具有广阔的发展前 景。 本文对支持向量机理论进行了研究 ,并结合实例 研究给出了一个基于支持向量机数据挖方法的面向 电子商务的智能客户关系管理模型 。
武汉大学学报 ,2002 ,48 (6) :733 - 736.
[ 4 ] 秦寿康 . 最优化理论和方法 [ M ] . 北京 : 电子工业出版社 ,1985. [ 5 ] Guo G , Stan Z L , Chan K. Face Recognition by Support Vector Machines[ A ] . 196?201. Proceedings of Fourt h IEEE International
Conference on Automatic Face and Gesture Recognition[ C] . 2000.
[ 6 ] Hat haway R J , Bezdek J C. Optimization of Clustering Criteria by Reformulation[J ] . IEEE Transactions Fuzzy Systems , 1995 ,
3 (2) : 241 - 245. [ 7 ] 王国庆 ,钟义庆 . 支持向量机的若干新进展 [J ] . 电子学报 ,2001 , 29 (10) :1398 - 1400. [ 8 ] 唐俊松 ,张金隆 ,蔡淑琴 . 论电子商务时代的客户关系管理 [J ] .
参考文献 :
[ 1 ] Vapnik V. The nature of statistical learning t heory[ M ] . New
软科学 ,2001 ,15 (1) :93 - 95.
培训信息
客户管理岗位资格证书培训
——深度开发以客户为中心的管理新技能 — 交付迟缓、 服务响应速度的缓慢、 销售额和利润的不断下滑、 客户满意度下降 ,这些意味着一个个挑战 : 你 对最有价值的客户了解有多深 ? 客户管理岗位资格证书培训由此应运而生。 年初由上海紧缺人才培训工程 2004 联席会议办公室推出该项目。 相应的培训机构主要对参加培训者的客户管理知识和操作能力实施强化训练 ,旨 在深度开发以客户为中心的管理新技能。 该岗位资格证书分为主管、 经理、 总监三大级别 ,随着培训和认证的开 展 ,该系列证书将成为营销、 客服及管理人士关注的热点。 更多信息可致电查询 : ( 021) 51013288 或 ( 021) 58807770 。 小档案 :
认证等级 主管 经理 总监 适合对象
客户管理岗位资格认证各级别侧重点对比示例 五加一最新开班动态
业务销售 、 客户服务代表 、 大宗客户服务 、 市场调查 、 售后服务 、 前台服务 、 电话 客户服务 、 投诉热线服务 、 及一线专业客户服务等人员 客服部主管 、 工程师 、 业务经理 、 行政经理 、 企划经理 、 公关经理 、 市场开发经理 等人员 大客户经理 、 客服总监 、 高级工程师 、 厂长 、 副总经理等人员
首期 4 月底同时开班
首期 5 月中旬开班
常见小问答 : 证书级和职业文凭级有哪些区别 ?
级别 证书级 职业文凭级 适合对象 初入行者 资深培训师
考核内容特点
考核形式特点 实操 + 2 小时书面考试 实操 + 3 小时书面考试
广泛的培训基本技巧 深度培训技术和理论
— 82
—
更多相关文档:
电子商务环境下数据挖掘在客户关系管理的应用 开题报告
本文正是从客户和信息挖掘的双重角度进行客户与信息资源的优化组合, 使 企业取得市场竞争优势, 而提出了电子商务环境下基于数据挖掘的客户关系管理 的研究课题。 (2...
数据挖掘技术在电子商务客户关系管理中的应用研究
数据挖掘技术在电子商务客户关系管理中的应用研究_销售/营销_经管营销_专业资料。...如 邹鹏等基于决策树方法给出了一个客户利润贡献度的评价模型;张酷等人用一种...
电商系统中的数据分析方法研究
的挖掘目的, 发现并选择适 当的数据挖掘算法或模型...的挖掘技术, 以使面向 电子商务的数据挖掘研究更加...但多与客户关系管理中对客户的群体聚类、 客户细分...
电子商务环境下数据挖掘在客户关系管理的应用
论文重点讨论得几个客户关系分析模型有助于 强化客户关系管理的量化指标, 并有利于充分发挥数据挖掘在客户关系管理中的作用。 论文 关于数据挖掘在客户关系管理中商业...
电子商务环境下的客户关系管理研究文献综述
数据挖掘 1、前言电子商务环境下的客户关系管理,是...位于模型中的共享数据库作为所有 eCRM 过程的转换...CRM 是企业的面向客户前台,是企业价值实现的最后步骤...
面向电子商务行业的客户关系管理系统
《面向电子商务行业的客户关系管理系统》 分析与设计...4、 客户分类模型。1)模型的建立;2)模型的管理; ...(数据挖掘与数据仓库) 文档贡献者 mocun7777777 贡献...
电子商务环境下数据挖掘在客户关系管理的应用 文献综述
电子商务环境下基于数据库和数据挖掘技术的客户关系管理客户关系管理的原理 CRM 源于“以客户为中心”的新型商业模式,是一种旨在改善企业与客户之 间关系的新型管理机...
更多相关标签:
如何挖掘客户潜在需求 | 商务智能与数据挖掘 | 面向对象模型 | 如何挖掘客户需求 | 如何挖掘潜在客户 | 挖掘客户需求 | 面向对象数据模型 | 如何深度挖掘客户需求 |本文关键词:面向电子商务的客户关系管理数据挖掘模型研究,由笔耕文化传播整理发布。
本文编号:146160
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/146160.html