面向银行信贷分析的关联规则挖掘算法研究
发布时间:2021-05-18 02:39
近年来,随着社会的发展,银行业务呈多样化,个人信贷业务逐渐兴起,盈利空间非常大。目前,大部分银行主要依靠工作人员根据自己的经验对客户进行评估来决定是否放贷,这其中主观性很强,对评估结果有一定的影响。如果能够通过数据科学地分析出哪些人在银行交易中信用度较高,那么就可以对这些人进行放贷,进而增加银行收益。在众多挖掘算法中,Apriori算法被人们使用的最多,近些年已被应用于对各行各业数据的挖掘研究。在Apriori算法的运行过程中,它是存在一些缺点的。其一是在数据库扫描方面,会进行多次扫描,这无疑会增加I/O开销。其二,在自链接过程中产生的候选项集过多,算法运行时间长。其三,Apriori算法是串行算法,无法满足大数据的挖掘。本文分析了改进的AprioriTid算法,然后分析该算法的不足,提出对项集约减和排序的改进算法AprioriCut。该算法只扫描一次数据库并能减少数据集,减少数据集的遍历,还能够减少候选项集的个数,避免无用的候选项集的产生。本文首先介绍了选题背景与意义,然后对研究所能用到的相关理论知识进行了详细介绍。接着研究介绍了 Apriori算法原理。随后,...
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 银行信用数据分析研究现状
1.2.2 数据挖掘与关联规则挖掘研究现状
1.3 论文主要内容
1.4 论文工作安排
2 相关理论与技术分析
2.1 数据挖掘相关理论
2.1.1 数据挖掘定义
2.1.2 数据挖掘的过程
2.1.3 数据挖掘主要方法
2.2 Hadoop分布式平台
2.2.1 Hadoop简介
2.2.2 Hadoop优点
2.3 HDFS分布式存储系统
2.4 MapReduce分布式计算框架
2.4.1 MapReduce编程模型
2.4.2 MapReduce工作流程
2.5 小结
3 Apriori算法分析与改进
3.1 Apriori算法
3.1.1 Apriori算法概述
3.1.2 Apriori算法的基本概念
3.1.3 Apriori算法的基本思想
3.1.4 Apriori算法的实现
3.2 Apriori改进算法
3.2.1 Apriori算法存在的问题
3.2.2 AprioriTid算法
3.2.3 Apriori_Cut算法原理
3.2.4 Apriori_Cut算法实现
3.2.5 Apriori_Cut算法实例
3.3 小结
4 算法的并行化
4.1 Apriori算法运行大数据的缺点
4.2 Hadoop平台下的Apriori算法
4.3 Hadoop平台下的AprioriTid算法
4.4 Hadoop平台下的Apriori_Cut算法
4.5 小结
5 算法实验分析
5.1 实验环境搭建
5.1.1 实验环境
5.1.2 Hadoop平台搭建
5.2 不同数据规模下的算法实验
5.3 不同支持度下的算法实验
5.4 小结
6 并行化Apriori_Cut算法在银行信贷分析中的应用
6.1 研究过程模型
6.2 数据预处理
6.2.1 数据的来源
6.2.2 数据预处理
6.3 数据挖掘与结果分析
6.4 小结
结论
参考文献
致谢
作者简历及攻读硕士学位期间的科研成果
【参考文献】:
期刊论文
[1]Trajectory Big Data Processing Based on Frequent Activity[J]. Amina Belhassena,Hongzhi Wang. Tsinghua Science and Technology. 2019(03)
[2]Foundation Study on Wireless Big Data: Concept, Mining, Learning and Practices[J]. Jinkang Zhu,Chen Gong,Sihai Zhang,Ming Zhao,Wuyang Zhou. 中国通信. 2018(12)
[3]大数据时代下数据挖掘技术的应用[J]. 刘铭,吕丹,安永灿. 科技导报. 2018(09)
[4]基于大数据的关联规则Apriori算法的研究与改进[J]. 王倬,李丹. 图书情报工作. 2016(S2)
[5]一种改进的挖掘关联规则Apriori算法[J]. 王志春. 电脑知识与技术. 2015(34)
[6]关联规则挖掘中Apriori算法的研究与改进[J]. 崔贯勋,李梁,王柯柯,苟光磊,邹航. 计算机应用. 2010(11)
[7]分布式数据挖掘在银行信用风险评估中的应用[J]. 张毅. 科学时代. 2009(01)
[8]对关联规则挖掘Apriori算法的进一步改进[J]. 朱祥玉,侯德文,陈希. 信息技术与信息化. 2005(06)
[9]挖掘基于医疗图像的关联规则诊断乳腺癌[J]. 蒋良孝,蔡之华. 计算机工程与应用. 2003(20)
硕士论文
[1]基于粗糙集理论的商业银行信用风险评估研究[D]. 钱佳丽.南京邮电大学 2018
[2]Apriori改进算法在教学评价中的应用[D]. 郑丽生.华侨大学 2015
[3]云计算环境下基于Apriori算法的气象数据关联规则分析研究[D]. 黄钧晟.南京信息工程大学 2015
[4]数据挖掘在银行信用风险管理中的应用及实证研究[D]. 崔毅.电子科技大学 2010
[5]基于数据挖掘的银行信用评分系统研究[D]. 陈靓.辽宁师范大学 2006
本文编号:3192950
【文章来源】:大连海事大学辽宁省 211工程院校
【文章页数】:62 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
1 绪论
1.1 选题背景和意义
1.2 国内外研究现状
1.2.1 银行信用数据分析研究现状
1.2.2 数据挖掘与关联规则挖掘研究现状
1.3 论文主要内容
1.4 论文工作安排
2 相关理论与技术分析
2.1 数据挖掘相关理论
2.1.1 数据挖掘定义
2.1.2 数据挖掘的过程
2.1.3 数据挖掘主要方法
2.2 Hadoop分布式平台
2.2.1 Hadoop简介
2.2.2 Hadoop优点
2.3 HDFS分布式存储系统
2.4 MapReduce分布式计算框架
2.4.1 MapReduce编程模型
2.4.2 MapReduce工作流程
2.5 小结
3 Apriori算法分析与改进
3.1 Apriori算法
3.1.1 Apriori算法概述
3.1.2 Apriori算法的基本概念
3.1.3 Apriori算法的基本思想
3.1.4 Apriori算法的实现
3.2 Apriori改进算法
3.2.1 Apriori算法存在的问题
3.2.2 AprioriTid算法
3.2.3 Apriori_Cut算法原理
3.2.4 Apriori_Cut算法实现
3.2.5 Apriori_Cut算法实例
3.3 小结
4 算法的并行化
4.1 Apriori算法运行大数据的缺点
4.2 Hadoop平台下的Apriori算法
4.3 Hadoop平台下的AprioriTid算法
4.4 Hadoop平台下的Apriori_Cut算法
4.5 小结
5 算法实验分析
5.1 实验环境搭建
5.1.1 实验环境
5.1.2 Hadoop平台搭建
5.2 不同数据规模下的算法实验
5.3 不同支持度下的算法实验
5.4 小结
6 并行化Apriori_Cut算法在银行信贷分析中的应用
6.1 研究过程模型
6.2 数据预处理
6.2.1 数据的来源
6.2.2 数据预处理
6.3 数据挖掘与结果分析
6.4 小结
结论
参考文献
致谢
作者简历及攻读硕士学位期间的科研成果
【参考文献】:
期刊论文
[1]Trajectory Big Data Processing Based on Frequent Activity[J]. Amina Belhassena,Hongzhi Wang. Tsinghua Science and Technology. 2019(03)
[2]Foundation Study on Wireless Big Data: Concept, Mining, Learning and Practices[J]. Jinkang Zhu,Chen Gong,Sihai Zhang,Ming Zhao,Wuyang Zhou. 中国通信. 2018(12)
[3]大数据时代下数据挖掘技术的应用[J]. 刘铭,吕丹,安永灿. 科技导报. 2018(09)
[4]基于大数据的关联规则Apriori算法的研究与改进[J]. 王倬,李丹. 图书情报工作. 2016(S2)
[5]一种改进的挖掘关联规则Apriori算法[J]. 王志春. 电脑知识与技术. 2015(34)
[6]关联规则挖掘中Apriori算法的研究与改进[J]. 崔贯勋,李梁,王柯柯,苟光磊,邹航. 计算机应用. 2010(11)
[7]分布式数据挖掘在银行信用风险评估中的应用[J]. 张毅. 科学时代. 2009(01)
[8]对关联规则挖掘Apriori算法的进一步改进[J]. 朱祥玉,侯德文,陈希. 信息技术与信息化. 2005(06)
[9]挖掘基于医疗图像的关联规则诊断乳腺癌[J]. 蒋良孝,蔡之华. 计算机工程与应用. 2003(20)
硕士论文
[1]基于粗糙集理论的商业银行信用风险评估研究[D]. 钱佳丽.南京邮电大学 2018
[2]Apriori改进算法在教学评价中的应用[D]. 郑丽生.华侨大学 2015
[3]云计算环境下基于Apriori算法的气象数据关联规则分析研究[D]. 黄钧晟.南京信息工程大学 2015
[4]数据挖掘在银行信用风险管理中的应用及实证研究[D]. 崔毅.电子科技大学 2010
[5]基于数据挖掘的银行信用评分系统研究[D]. 陈靓.辽宁师范大学 2006
本文编号:3192950
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3192950.html