当前位置:主页 > 经济论文 > 经济管理论文 >

几种常用数据挖掘算法的应用案例与分析

发布时间:2021-07-04 18:14
  随着信息技术的迅速发展和计算机信息系统的广泛运用,企业经营活动中产生了大量数据,这些数据真实地反应了企业经营的实际状况。然而,海量数据使得我们无所适从,产生了“数据丰富而知识贫乏”的现象。海量数据的背后,往往隐藏着许多拥有决策意义的信息和知识,如果能够对海量数据进行分析,发现它们之间存在的潜在关系,就能为企业的经营、管理和决策提供支持。基于上述背景,数据挖掘技术应运而生,在很多领域得到广泛应用,其方法主要包括分类、回归、聚类、预测、时间序列分析、关联规则、Web挖掘、数据可视化等。在激烈的市场竞争环境下,很多企业为了能更客观的把握自身以及市场的商业状况,提升快速响应外部环境变化和内部经营管理和决策力度,希望运用有效的数据分析工具,更多地分析出隐藏在数据中的那些有价值的、能够辅助管理和决策的信息和知识。基于以上背景,论文运用数据挖掘软件SPSS Clementine(Modeler)对相关数据进行分析,分别采用了关联规则、K-means算法、决策树以及Logistic回归模型等常用数据挖掘方法,找出隐藏在这些数据中的潜在信息,从而为企业在商业运作中提供有效的决策支持。通过几种常用数据挖掘... 

【文章来源】:景德镇陶瓷大学江西省

【文章页数】:44 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 国内外研究现状
    1.2 论文研究的主要内容
    1.3 论文的结构安排
2 决策树算法在学生购买手机中的分析与应用
    2.1 决策树
        2.1.1 ID3算法
        2.1.2 信息增益计算方法
        2.1.3 ID3算法流程
        2.1.4 C4.5及C5.0简介
    2.2 SPSS Clementine软件介绍
    2.3 数据处理
    2.4 实验过程
    2.5 结果分析
3 K-Means算法在员工离职中的分析与应用
    3.1 聚类分析
    3.2 数据处理
    3.3 实验过程
    3.4 结果分析
4 关联规则挖掘在客户购买商品中的分析与应用
    4.1 关联规则
    4.2 数据处理
    4.3 实验过程
    4.4 结果分析
5 logistic回归模型在睡眠客户预测中的应用与分析
    5.1 Logistic回归模型
        5.1.1 一元logistic回归
        5.1.2 多元logistic回归
        5.1.3 Logistic回归假设条件
    5.2 数据处理
        5.2.1 数据来源
        5.2.2 数据整理
        5.2.3 确定高价值用户
    5.3 睡眠用户定义
    5.4 建立模型及模型评估
        5.4.1 变量选取
        5.4.2 变量处理
        5.4.3 模型建立
        5.4.4 模型评估
    5.5 结果分析
6 结论与展望
    6.1 论文研究的主要内容
    6.2 取得的预期成果
    6.3 存在的不足及今后进一步研究的内容
致谢
参考文献


【参考文献】:
期刊论文
[1]基于聚类分析和判别分析的学业质量评价研究[J]. 聂淑媛,谈发.  吉林省教育学院学报(上旬). 2015(02)
[2]因子分析法和聚类分析法在网上银行客户满意度研究中的应用[J]. 赵小宁,李凤霞.  时代金融. 2015(03)
[3]基于因子分析和聚类分析上市房地产公司的财务风险评价[J]. 郭立硕,王兆刚,李星.  中小企业管理与科技(下旬刊). 2015(01)
[4]中国6个民族的面部几何特征聚类分析[J]. 李志洁,段晓东,王存睿.  大连民族学院学报. 2015(01)
[5]基于决策类划分新型多变量决策树算法实例分析[J]. 黄俊南.  齐齐哈尔大学学报(自然科学版). 2015(01)
[6]决策树算法在村镇银行信用风险预警中的应用研究[J]. 安英博,张宇敬,齐晓娜.  无线互联科技. 2015(01)
[7]Perturbation analysis for the normalized Laplacian matrices in the multiway spectral clustering method[J]. BORJIGIN SuMuYa,GUO ChongHui.  Science China(Information Sciences). 2014(11)
[8]基于数据挖掘的决策树算法分析[J]. 杜丽英.  吉林建筑工程学院学报. 2014(05)
[9]基于决策树算法的银行客户分类模型[J]. 尹鹏飞,欧云.  吉首大学学报(自然科学版). 2014(05)
[10]水稻泛素缀合酶基因OsUbc13的分子特征和蛋白互作研究(英文)[J]. Ya WANG,Meng-yun XU,Jian-ping LIU,Mu-gui WANG,Hai-qing YIN,Ju-min TU.  Journal of Zhejiang University-Science B(Biomedicine & Biotechnology). 2014(07)

硕士论文
[1]聚类分析模型在纳税评估中的应用[D]. 陈艳伍.湖北大学 2013
[2]基于乘法扰动的数据挖掘隐私保护算法研究[D]. 石雅强.广东工业大学 2012
[3]决策树算法在保险营销员流失预测中的研究与应用[D]. 宋祖全.兰州大学 2012
[4]基于数据挖掘的通信网络告警相关性研究[D]. 安欢.北京邮电大学 2012
[5]数据挖掘在移动通信CRM中的应用[D]. 刘畅.北京邮电大学 2011
[6]移动通信集团客户价值评估模型的研究[D]. 操宜洁.上海交通大学 2011
[7]关联规则分析在超市营销中的应用研究[D]. 于芳.哈尔滨工业大学 2010



本文编号:3265287

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jingjiguanlilunwen/3265287.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户80e3b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com