当前位置:主页 > 管理论文 > 客户关系论文 >

聚类挖掘在电信客户分类中的研究与应用

发布时间:2019-03-13 15:29
【摘要】:客户关系管理(Customer Relationship Management)简称(CRM)对改善客户与企业间的关系,有着至关重要的作用。对庞大客户信息的高效、精准的分类,是进行有效客户管理的基础和重要技术。提高电信企业竞争力的重点在于,如何将数据库中看似毫无关联不具备价值的数据通过系统的整合,提炼出有用的数据信息,并对此进行分析研究来制定差异化以及个性化的服务。 数据挖掘通过数据分析,从大量的原始数据里发现其内在规律。其工作过程一是数据准备:从相关数据库中选取数据,这些数据又会被整合成可以被用于数据挖掘的数据集合;二是发现规律:使用数据准备时所得到的数据集合,采用某种方法,将这些数据集合之间的规律寻找和总结出来。本文主要针对数据挖掘技术中的一个重要领域:聚类分析进行研究分析并将其投入到现实企业决策中去。聚类挖掘其本质就是要将那些非实体的对象集合分组,使之成为由许多相似对象所形成的对象类的一个过程,其主要工作就是把收集来的那些相似的数据进行分类和聚合。 本文参阅了大量的国内与国外的文献资料,对数据挖掘技术、客户关系管理系统、电信行业客户分类模型进行了深入且细致的研究。针对基于聚类挖掘的客户关系管理系统中的客户分类,开展了以下几项研究工作: 1.建立有利于数据分析的客户分类模型。客户分类模型的建立将大大提高电信企业对用户的分类,把具有某种消费习惯或者消费倾向的用户归集起来,本论文主要正对短信高频使用用户类,制定有针对性的营销策略。该客户分类模型可以将大量具有相似特征的用户归集起来,形成某个特定的客户类别,是企业能够量化的对某一用户类进行分析,制定适合的电信产品和服务。 2.从两方面入手对原有的K-means算法进行优化分析。其一本文对初始聚类中心进行优化:更好的划分效果是通过对原始聚类中心的选择而得到的。它使得不同聚类中的对象是不相似的,但一个聚类中的对象却是相似的。同时本文运用数学几何定律:“三角形两条边的长度必定大于第三条边”来降低k-means算法的总时间复杂度。以此来尽可能的达到减少迭代次数,,提高挖掘性能的目的。通过对比发现,优化后的算法比传统的K-means算法具有更好的性能。 3.确定客户分类模型中所用到的分类变量和描述变量。消费者由于各种因素之间的差异,本身也呈现出多样化,对于消费者而言,根本没有单一的策略可以对应所有客户的需求,单一的产品选择都不是一种优秀的战略选择,而客户分类在本质上就是为迅速提高一个大型多元化的组织管理水平提供了实际的可能性。客户分类以客户消费行为和客户价值为研究变量,将客户人口特征,参考客户心理消费因子作为参考依据,从而建立起了一套基于数据挖掘的客户分类模型。 4.将SPSS公司开发的Clementine7.0作为开发工具,对上述研究得出的客户分类模型通过电信客户数据进行验证,成功得出客户分类组。同时本文选取了聚类挖掘结果中的短信高频使用组为分析对象,对其消费习惯和消费倾向进行深入分析并制定出了相应的营销策略。结果表明:本文的工作将对改善电信行业的客户管理,提高用户满意度,以及提升电信运营商的市场竞争力,起到一定的支撑作用。
[Abstract]:Customer Relationship Management (CRM) plays an important role in improving the relationship between the customer and the enterprise. The efficient and accurate classification of large customer information is the foundation and important technology for effective customer management. The key point of improving the competitiveness of the telecom enterprise is how to make the data that appear to have no value in the database through the integration of the system, to extract useful data information, and to analyze the research to develop the differentiated and personalized service. Data mining, through data analysis, has found its inside gauge from a large number of raw data law. The process of work is data preparation: data is selected from the relevant database, and the data can be integrated into a collection of data that can be used for data mining; the second is the rule of discovery: the set of data obtained when using the data, and the use of a certain party The method of finding and summarizing the rules between the sets of data. This paper is mainly focused on an important field in data mining technology: the cluster analysis is used to study and analyze and put it into the decision-making of the real enterprise The essence of the clustering mining is to group the objects of the non-entities into a process of the class of objects formed by many similar objects, the main task of which is to classify and gather the similar data collected. In this paper, the author has made a deep and detailed study on the data mining technology, the customer relationship management system and the customer classification model of the telecom industry. The following research is carried out for the customer classification in the customer relationship management system based on the cluster mining. Research work:1. Establish a customer who is in favor of data analysis The establishment of the customer classification model will greatly improve the classification of the telecommunication enterprises to the users, and set the users with a certain consumption habit or the consumption tendency. The customer classification model can set a large number of users with similar features together to form a specific customer category, which can be quantified by the enterprise to analyze a certain user class and formulate a suitable telecommunication system. product and service.2. Start with the original K-means calculation from two aspects In this paper, the initial cluster center is optimized: the better partitioning effect is through the original clustering center It makes the objects in different clusters not similar, but in one cluster The object is similar. At the same time, the paper applies the law of mathematical geometry: the "The length of the two sides of the triangle must be greater than the third edge" to reduce the k-means algorithm the total time complexity can be achieved as much as possible to reduce the number of iterations, increase, The purpose of the mining performance is to compare and find that the optimized algorithm is more than the traditional K-means algorithm. with better performance.3. Determine what is used in the customer classification model Categorical variables and description variables. The difference between a variety of factors is, in itself, a variety. For consumers, there is no single policy at all to correspond to the needs of all customers, and a single product choice is not An excellent strategic choice, and the customer classification is to improve the management level of a large and diversified organization in essence The actual possibility is provided. The customer classification takes the customer's consumption behavior and the customer value as the study variable. The customer's demographic characteristics, reference customer's psychological consumption factors are used as the reference basis, and a set of data based on the data is established. and 4. using the Clementine 7.0 developed by the SPSS, as a development tool, to carry out the test on the customer classification model obtained by the above research through the telecommunication customer data; At the same time, the paper selects the short message high-frequency use group in the cluster mining result group as the analysis object, and analyzes the consumption habit and the consumption tendency. The results show that the work of this paper will improve the customer management in the telecom industry, improve the user's satisfaction, and improve the market competition of the telecom operators.
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:TP311.13

【相似文献】

相关期刊论文 前10条

1 黄明,王武龙,梁旭;基于遗传算法的高效聚类挖掘新算法[J];大连铁道学院学报;2002年04期

2 雷红艳;邹汉斌;;限制隐私泄露的隐私保护聚类算法[J];计算机工程与设计;2010年07期

3 刘振名;赵可新;刘振亮;;多维数量关联规则聚类挖掘研究[J];煤炭技术;2011年06期

4 邓云桂;石雅迪;曹三省;;互动业务用户行为特征聚类挖掘算法研究[J];电视技术;2009年05期

5 李卫东,宋威,杨炳儒;利用数据挖掘方法分析客户生涯价值[J];计算机工程与应用;2005年06期

6 苏锦旗;吴慧欣;薛惠锋;;基于人工鱼群算法的聚类挖掘[J];计算机仿真;2009年02期

7 苟元琴;;聚类分析在图书馆馆藏书目中的挖掘与应用[J];内蒙古科技与经济;2009年13期

8 苏守宝;郁书好;陈明华;;基于智能计算的聚类挖掘研究进展[J];计算机测量与控制;2006年05期

9 姜华;孟志青;周克江;肖建华;;多粒度时间下的近似周期挖掘研究[J];计算机工程;2010年03期

10 张国荣;印鉴;;分布式环境下保持隐私的聚类挖掘算法[J];计算机工程与应用;2007年18期

相关会议论文 前10条

1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年

2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年

3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年

4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年

5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年

6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年

7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年

9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年

10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年

相关重要报纸文章 前10条

1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年

2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年

3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年

4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年

5 张立明;数据挖掘之道[N];网络世界;2003年

6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年

7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年

8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年

9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年

10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年

相关博士学位论文 前10条

1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年

2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年

3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年

4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年

5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年

6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年

7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年

8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年

9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年

10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年

相关硕士学位论文 前10条

1 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年

2 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年

3 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年

4 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年

5 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年

6 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年

7 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年

8 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年

9 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年

10 刘华敏;数据挖掘在高职院校学生成绩分析中的应用[D];安徽大学;2011年



本文编号:2439515

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/2439515.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户304a4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com