用户多维满意度评价预测系统
本文关键词:用户多维满意度评价预测系统,,由笔耕文化传播整理发布。
【摘要】:随着移动互联网的发展,电信运营商逐渐从服务提供商转变为内容提供商,开始为用户提供各种移动互联网数据业务。由于市场竞争日益激烈,电信运营商迫切需要提升市场竞争力,进一步满足用户的需求。数据挖掘技术为电信运营商的市场营销提供了一种新的思路,如何从海量的业务数据中获得有价值的知识用来辅助市场决策和精准服务已成为业内比较热门的课题。本文通过数据挖掘技术预测用户的满意度,达到了辅助了运营商进行精准服务的目的。论文主要工作如下:1)使用基于信息增益率的属性选择方法,从业务数据中筛选出用户满意度相关属性,并与调查问卷数据组合成待处理数据集。利用各类数据预处理技术,对数据进行清洗和过滤。然后,构建出一个完备数据集,用于预测模型的建立。最终,基于不均衡数据集处理的思想,提出了类标重新组合的方法,解决了由于数据不均衡问题产生的对小类分类精度下降的问题。2)针对用户满意度预测的问题,将其转化为用户在多个问题维度下分类的问题,提出了使用随机森林算法来构建预测模型的解决方案,实现了对用户每个维度满意度的评价预测;3)基于对用户问卷调查中问题间的关系,提出了使用基于标记关系的多标记分类算法优化分类模型的解决方案,提升了对用户的多维满意度评价的预测的效果。
【关键词】:数据挖掘 多标记学习 集成学习
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13
【目录】:
- 摘要6-7
- Abstract7-10
- 第一章 绪论10-17
- 1.1 研究背景及意义10
- 1.2 数据挖掘相关背景10-13
- 1.2.1 大数据的概念10-11
- 1.2.2 数据挖掘的概念11
- 1.2.3 数据挖掘的主要应用方向11-13
- 1.3 电信行业中精准营销的现状13-15
- 1.3.1 精准营销的目的13
- 1.3.2 精准营销的基本流程13-14
- 1.3.3 精准营销的应用场景14-15
- 1.4 本文工作及组织结构15-17
- 第二章 机器学习相关技术背景17-30
- 2.1 引言17
- 2.2 机器学习17-20
- 2.2.1 机器学习分绍17-18
- 2.2.2 机器学习的过程18
- 2.2.3 机器学习的目标18
- 2.2.4 机器学习的分类和算法18-20
- 2.3 单标记学习20-21
- 2.4 多标记学习21-25
- 2.4.1 问题定义21-22
- 2.4.2 求解策略22-23
- 2.4.3 算法分类23-25
- 2.5 性能度量25-29
- 2.5.1 单标记学习性能度量25-26
- 2.5.2 多标记学习性能度量26-29
- 2.6 本章小结29-30
- 第三章 属性选择与数据预处理30-48
- 3.1 引言30
- 3.2 问题描述30
- 3.3 属性选择30-33
- 3.3.1 属性选择简介30-31
- 3.3.2 信息增益和信息增益率31-32
- 3.3.3 基于信息增益率的用户属性选择32-33
- 3.4 数据集构建33-34
- 3.5 数据预处理34-35
- 3.5.1 属性数据处理34-35
- 3.5.2 类标数据处理35
- 3.6 不均衡数据集35-39
- 3.6.1 数据不均衡的概念35
- 3.6.2 现有数据不均衡处理方法35-37
- 3.6.3 不均衡数据集问题的性能度量37-39
- 3.7 类标数据的处理39-40
- 3.7.1 现有数据集特点39
- 3.7.2 处理不均衡数据39-40
- 3.8 基于RANDOM FOREST算法的预测模型构建40-46
- 3.8.1 集成学习及算法介绍40-44
- 3.8.2 基于Random Forest算法的预测模型构建44-46
- 3.9 实验46-47
- 3.9.1 实验设置46
- 3.9.2 实验结果46-47
- 3.9.3 结果分析47
- 3.10 本章小结47-48
- 第四章 基于多标记学习的模型构建48-59
- 4.1 引言48
- 4.2 常见的基于标记关系的算法介绍48-53
- 4.2.1 Calibrated Label Ranking算法48-50
- 4.2.2 Random k-Labelsets算法50-51
- 4.2.3 ML-KNN算法51-53
- 4.3 基于CLASSIFIER CHAINS算法的用户数据挖掘53-56
- 4.3.1 Classifier Chains算法介绍53-55
- 4.3.2 基于Classfier Chains算法的预测模型构建55-56
- 4.4 实验56-58
- 4.4.1 实验设置56-57
- 4.4.2 实验结果57-58
- 4.4.3 结果分析58
- 4.5 本章小结58-59
- 第五章 总结与展望59-61
- 5.1 本文工作总结59
- 5.2 不足与展望59-61
- 参考文献61-65
- 致谢65-66
- 附录66-67
【相似文献】
中国期刊全文数据库 前10条
1 香丽芸;浅谈数据挖掘及其应用[J];昌吉师专学报;2001年02期
2 郑雪燕,张杰明,岳洋;数据挖掘语言[J];计算机时代;2001年11期
3 刘明晶;数据挖掘[J];华南金融电脑;2001年04期
4 张伟;刘勇国;彭军;廖晓峰;吴中福;;数据挖掘发展研究[J];计算机科学;2001年07期
5 钟晓;马少平;张钹;俞瑞钊;;数据挖掘综述[J];模式识别与人工智能;2001年01期
6 朱建平,张润楚;数据挖掘的发展及其特点[J];统计与决策;2002年07期
7 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
8 李峻;数据挖掘,企业洞察先机的“慧眼”[J];中国计算机用户;2002年48期
9 罗可,蔡碧野,卜胜贤,谢中科;数据挖掘及其发展研究[J];计算机工程与应用;2002年14期
10 ;2002数据挖掘研讨班[J];计算机工程;2002年06期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 邬文帅;基于多目标决策的数据挖掘方法评估与应用[D];电子科技大学;2015年
6 谢邦彦;整合数据挖掘与TRIZ理论的质量管理方法研究[D];首都经济贸易大学;2010年
7 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
8 李玉华;面向服务的数据挖掘关键技术研究[D];华中科技大学;2006年
9 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
10 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
本文关键词:用户多维满意度评价预测系统,由笔耕文化传播整理发布。
本文编号:354669
本文链接:https://www.wllwen.com/guanlilunwen/yingxiaoguanlilunwen/354669.html