当前位置:主页 > 经济论文 > 企业经济论文 >

基于深度学习的大型企业非增值税欠税预测

发布时间:2020-04-02 16:35
【摘要】:随着人工智能的不断发展和应用,通过深度学习等方法对大量的数据进行分析和预测,将得到的结果应用于各个所需领域,为各个所需领域带来很多便利。本文利用深度学习算法针对税收数据进行大型企业非增值税欠税预测,能够更好地为税务稽查人员服务,提高稽查人员的决策质量和效率,从而保障国家的税收收入。在对税收数据进行分析时,其数据量庞大且复杂,难以直接对数据进行分析,因此在税收分析预测过程中需要对原始数据进行处理,建立符合业务逻辑、满足需求的数据仓库,它是以南海区大型企业的缴税信息数据和基本信息数据为基础,结合专业税务知识对数据进行预处理,清洗掉非法数据、冗余数据、错误数据等其他形式的噪声数据,建立符合本文主题的事实表和多个维表,从而建立的非增值税税务数据仓库。随后以非增值税税收数据仓库中的数据为基础从多个维度去考虑影响企业欠税的特征属性,实验发现企业欠税行为与地理区域、行业类型、注册类型有一定的时间关联性,最终结合税务人员提供的有关知识和经验确定影响企业欠税的多个特征属性,其中包含了财务方面的数据、纳税人的信息、纳税数据。最后,根据企业前一年影响企业欠税的特征属性数据来预测下一年是否会发生欠税行为,研究以深度学习算法为基础的企业欠税预测模型,并对模型输入层、隐含层、输出层的设计及模型优化。使用佛山市南海区税务机关提供的2015年和2016年非增值税税收相关数据,对预测模型进行准确率验证,分别对每一步优化得出的预测准确率进行记录和分析,目前得出最高平均预测准确率为88.45%,对比人工预测和计量等传统方法预测欠税不足80%的准确率有大幅度提高,并且使用多维度数据更加具有说服力,从而证明基于深度学习算法的企业欠税预测模型具有合理性与可靠性,为税务机关单位提供科学合理的研究思路。
【图文】:

层次结构图,数据仓库,层次结构


图 2-2 数据仓库的层次结构其中海量数据源(库)是多渠道总合的数据集;数据获取层主要是把决需要的数据从海量的数据源(库)中获取,并对其进行必需的清理、转换合,将处理过的数据加载至数据获取层的数据库内;数据存储层重点是将步骤的数据存储,将这些特定主题数据按照某种组织或结构形式化储存;分析层主要是对数据进行全面的分析,运用多种方法,例如结合数据仓库度学习算法,不仅可以能够帮助解决数据分析的任务,还能提搞准确度。分析是以数据仓库为基础,对数据中潜在知识更深层的理解,所以,它是仓库应用的非常关键的一个过程。数据仓库中有关的专业术语为:1) 元数据:它是用来给数据仓库的对象定义的一种重要数据,较为典型是位于传统的数据库里的数据字典,它可以将库中的基本数据添加时标签、提取数据的源、被数据清理等操作创建元数据。

特殊方式,无监督学习,识别错误,特征化


启了深度学习无论是在学术界还是工业界的巨大浪潮。其主要人工神经网络的一些优点,如具有非常好的特征化学习能力,始化”这种无监督学习的方式来克服训练上的难度,,并且学习视化或分类。“逐层初始化”[24]其基本思想为:所有的网络层化”这一特殊方式进行学习;同时,把上一层网络的输出作为整个网络调优,具体使用的是 wake-sleep 算法。深度学习的逐渐域都应用的很出色,从 2011 年以后,微软研究院与 Google 公面有了重大突破。他们均采用了深度神经网络技术,将语音的降,降至了 20%-30%的水平。第二年,这项技术又在图像识别 ImageNet 上图像识别错误率降低到百分之十五,2017 年,图到了百分之五。
【学位授予单位】:佛山科学技术学院
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP18;F275.4

【相似文献】

相关期刊论文 前10条

1 马宏新;;数据仓库技术在高速公路数据仓库系统中的应用[J];吉林交通科技;2011年01期

2 郝雅萍;;计算机数据仓库的构建原理及发展趋势[J];延边教育学院学报;2018年06期

3 林琳;;七大云计算数据仓库[J];计算机与网络;2019年20期

4 刘皓;;基于网络数据仓库及OLAP技术的决策支持系统设计[J];网络安全技术与应用;2015年11期

5 王锋;;维数据仓库及其在复杂数据建模中的应用研究[J];通讯世界;2015年03期

6 刘静;刘丽红;张竹绿;田野;;使用数据清洗技术进行中医药数据仓库质量控制研究[J];中国数字医学;2012年04期

7 蒋彬;余肖生;王东娟;姜艳静;赵美林;;数据仓库构建之行为模式分析[J];信息系统学报;2013年01期

8 崔愿星;;浅析数据仓库与数据挖掘的应用[J];内江科技;2014年01期

9 韩蕊;;大数据让数据仓库更具价值[J];互联网周刊;2014年02期

10 谭光玮;武彤;;基于生产线质量控制系统的动态数据仓库解决方案[J];微型机与应用;2014年07期

相关会议论文 前10条

1 邹勇;宋楠;仇道霞;王冬青;陈松;;数据仓库信息搜索系统探索[A];中国烟草学会2012年学术年会论文集[C];2012年

2 金周;;基于数据仓库的能耗指标查询体系[A];全国冶金自动化信息网2009年会论文集[C];2009年

3 王晓玲;谢鸿强;刘安;董逸生;;数据仓库建模工具的研制[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

4 张德辉;李建中;;多维压缩数据仓库上的并行聚集算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

5 潘海为;李建中;;数据仓库的并行加载算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

6 丁峰;邓勇;沈钧毅;;数据仓库中进行数据维护的方法研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年

7 宋荷庆;胡华;;在证券公司业务中建造数据仓库[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年

8 隋琪;王海洋;;一种基于数据仓库的服务评估方法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年

9 宋国杰;杨冬青;林子雨;唐世渭;王腾蛟;谢昆青;;实时主动数据仓库的概念、问题及应用[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年

10 周训伟;鲍泓;;泛矩阵——数据仓库中OLAP操作的数学基础[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年

相关重要报纸文章 前10条

1 Snowflake公司联合创始人 Benoit Dageville 编译 陈琳华;云数据仓库的下一步发展趋势[N];计算机世界;2020年

2 James Kobielus 编译 陈琳华;数据湖正在成为新的数据仓库[N];计算机世界;2019年

3 全民 英大泰和财产保险股份有限公司 赵永坚 中煤财产保险股份有限公司;保险企业信息化回顾及信息化保险展望[N];中国保险报;2017年

4 陈玉飞 周涛;人工智能能代替指挥员吗[N];解放军报;2017年

5 张静;大数据时代数据仓库的技术跟进[N];中国信息化周报;2014年

6 本报记者 程彦博;海关数据仓库云平台:大块头有大智慧[N];中国计算机报;2013年

7 本报记者 邹大斌;数据仓库、Hadoop,一个都不能少[N];计算机世界;2013年

8 张中淋 李亮 陈涛 中国石油内江销售公司 中国石油四川销售公司;如何建设数据仓库[N];计算机世界;2013年

9 寿川;2002Teradata数据仓库峰会在上海召开[N];市场报;2002年

10 记者 举薇;Teradata数据仓库上海争峰[N];中国证券报;2004年

相关博士学位论文 前10条

1 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年

2 陈湘涛;数据仓库与数据挖掘技术在新型铝电解控制系统中的应用研究[D];中南大学;2004年

3 周丽娟;数据仓库中实视图的选择与维护技术的研究[D];哈尔滨工程大学;2004年

4 李学锋;矿山企业数据仓库的应用研究[D];昆明理工大学;2005年

5 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年

6 李泽海;数据仓库中多维数据处理与查询相关技术的研究[D];吉林大学;2005年

7 王文铭;基于数据仓库的矿山企业信息系统及其应用研究[D];东北大学;2000年

8 麦永浩;数据仓库和数据挖掘方法研究及其在公安信息建设中的应用[D];华东理工大学;2000年

9 王华秋;并行数据挖掘理论研究与应用[D];重庆大学;2006年

10 冯玉;数据仓库环境中近似查询处理技术研究[D];中国科学院研究生院(计算技术研究所);2002年

相关硕士学位论文 前10条

1 段然;基于深度学习的大型企业非增值税欠税预测[D];佛山科学技术学院;2018年

2 张翼翔;基于SAP BW模型架构的企业级数据仓库应用研究[D];上海交通大学;2018年

3 刘俊;动车组关键部件数据处理方法研究与实现[D];北京交通大学;2019年

4 聂畅;基于数据仓库的医院数据分析与决策支持系统的设计与实现[D];云南大学;2018年

5 骆龙飞;基于BIEE营销数据分析系统的设计与优化[D];武汉轻工大学;2018年

6 金刚;基于规则的用户全景视图的设计与实现[D];上海交通大学;2015年

7 俞忆青;基于数据仓库的四重采集系统的设计与实现[D];上海交通大学;2016年

8 赵靓;基于数据仓库与Hadoop的移动广告平台设计与实现[D];上海交通大学;2016年

9 王志华;信息化作业指导系统在印刷企业精益管理中的应用[D];华南理工大学;2019年

10 彭先清;数据仓库中联机分析系统的研究与实现[D];电子科技大学;2019年



本文编号:2612180

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/xmjj/2612180.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户31896***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com