银行业中数据仓库的设计及数据挖掘算法的实现
发布时间:2019-01-18 12:02
【摘要】:随着全球互联网经济的迅速发展,互联网金融、网络购物、网上银行等电子商务的发展势头迅猛。尤其是中国经济蓬勃增长的今天,银行客户服务环节正经历着严峻的挑战。由于外资银行抢先一步收到网络革命的洗礼,在进入中国市场之后,在电子化、网络化银行方面比中国银行显示出更为优秀的潜质。拥有全球相当大市场份额的中国互联网金融市场,面对外资银行的冲击,面临严峻的挑战。另一方面,计算机相关技术的迅猛发展,使得数据仓库(DW)、数据挖掘(DM)等数据分析类技术日趋成熟。同时,面对我国金融领域进一步面向全球开放,银行业内的竞争趋势日显突出,而在此竞争过程中,信息化成熟度的影响尤为重要。银行业中,信息化的过程分为业务信息化阶段、大数据集中阶段和数据处理阶段。据今年各大银行年报分析,大多数银行现已完成大数据集中阶段。从客户层面考虑,银行为了更好的向客户提供服务,自然地选择了数据仓库及数据挖掘技术做为数据处理以及之后服务客户的技术支撑平台。对于目前大部分银行的业务,现已可以完成数据仓库高效地记录、统计、更改、查询客户数据环节。然而,为了深层次地挖掘客户信息,更好的向客户提供服务,目前各银行无法挖掘分析出数据中存在的关系,以及各客户数据属性贱的规则,更无法根据现有的客户数据进行分类分析,以致无法准确判断客户的消费需求。本文依托互联网金融的大环境,针对银行业中存在的大数据无法深度挖掘的现状,首先在数据仓库ETL整体流程中的数据转换模块,对进行处理后的源数据进行优化,提出了更优的KNN*算法,在进行数据挖掘的步骤前对数据进行了进一步的整理与筛选。接下来提出了银行数据在数据挖掘方面算法优化的观点,利用双重优化的Pro—Apriori决策树算法,对数据进行分类挖掘之后再进行预测判断,从而更便捷的处理银行业大数据中知识获取的难题。论文对我国银行领域实施部署行业级数据仓库、结构化数据挖掘技术、金融产品规划、完善客户分类、市场需求动态分析、加强客户关系管理、市场销售分析等各个方面有一定的指导性建议和借鉴意义。
[Abstract]:......
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13
本文编号:2410695
[Abstract]:......
【学位授予单位】:中国地质大学(北京)
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.13
【参考文献】
相关期刊论文 前4条
1 杜征征;;互联网金融营销的兴起与发展[J];银行家;2012年11期
2 孙铁利;刘延吉;;中文分词技术的研究现状与困难[J];信息技术;2009年07期
3 张启宇;朱玲;张雅萍;;中文分词算法研究综述[J];情报探索;2008年11期
4 孔芳;钱雪忠;;关联规则挖掘中对Apriori算法的一种改进研究[J];计算机工程与设计;2008年16期
相关博士学位论文 前1条
1 白雪;聚类分析中的相似性度量及其应用研究[D];北京交通大学;2012年
相关硕士学位论文 前6条
1 何爱元;基于词典和概率统计的中文分词算法研究[D];辽宁大学;2011年
2 史伟;中文自动分词关键技术研究与实现[D];电子科技大学;2008年
3 李宏波;综合字典和统计分析的中文分词系统的研究与实现[D];武汉理工大学;2010年
4 富卫军;中文信息抽取关键技术及应用研究[D];北京邮电大学;2010年
5 王艳华;面向生物医学领域的信息抽取研究[D];大连理工大学;2013年
6 黄翼彪;开源中文分词器的比较研究[D];郑州大学;2013年
,本文编号:2410695
本文链接:https://www.wllwen.com/guanlilunwen/kehuguanxiguanli/2410695.html