基于数据挖掘的税收执法督察选案方法的研究与应用
发布时间:2021-06-26 09:07
随着中国经济的腾飞,全社会都发生着巨大的变化。个人纳税和企业纳税在国家经济中占据着重要地位,地税部门在适应时代发展的同时,需要加大对其内部的监督力度。选案工作作为执法督察工作的第一步,是重中之重。现在普遍使用的是基于指标的计算机辅助选案方式,这种方式能够根据指标查找出所有具有疑点的案例,但是此方式使用的指标体系是人工凭借多年选案经验进行制定的,并默认指标体系是绝对可靠的,实际选案时间过久。因此想要加入数据挖掘技术手段,主动寻找最佳的解决办法,将预处理过的数据直接生成线索,从海量数据中找出具有高风险的数据,为执法督察人员提供重要的信息,并去判断这些线索的合理性,实现基于数据挖掘的计算机辅助选案。本文是基于某省级地方税务局的“风险监控平台”中执法督察模块,采用数据挖掘技术对税收执法督察选案工作进行研究与实现,着重分析了 K-均值聚类算法对初步加工后的数据进行降维聚类操作,根据纳税人之间的相似性将纳税人聚类,分析出具有高风险的纳税人,使用Apriori算法根据样本数据找到疑点数据发生的规律,找出会大概率出现的指标组合作为预测规则。将得到的预测规则与当前发生的违规行为相结合,预测纳税人可能还会...
【文章来源】:湖北大学湖北省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.1数据挖掘的基本步骤??
风险监控平台”后台数据库中,在GY市地方税务局下任意选取100个纳税人作为研??究样本,使用SQL语句将纳税人信息登记表以及从已缴税费表与应缴税费表中的重要??字段建立一个物化视图。由于篇幅有限,下
?是是?是??如下图3.5是Apriori算法实现流程图。在数据库中选取符合需求的样本数据,生成??候选数据集。在候选数据集中,根据最小支持度生成了满足条件的最大频繁项目集,将??生成的最大频繁集放到频繁集集合中。在频繁集中根据最小可信度产生强关联规则。??数荐庠候选数S集4生成频繁集一^成强关联规到'?■??图3.5?Apriori算法实现流程图??使用C#语言可以将Apriori算法移植进ASP.NET+Oracle的集合框架中,如图3.6是??项目中实现的核心代码,主要进行算法迭代,直至无法生成候选项目集。??//萁沄:s行迗代??Hs*c<Ite2TiSe*c>?Apridi?(AirrsylList;?Data?rArrsyiist;?AL?r?fIcat;?sup)??{??List;<It;emSet>?L?=?new?;//存鐘,§f有顏繁琪英??i?f?CAL.?Count?=?C?>?return?L;??else??{??im[]?Aiccuni:?=?new?:1二[5^.<^11111:];//扫_顼目矣#数蓉,德始化为<3??Ar2:syList?M^frs.quent?=?new?^rrsyList:?();//?〇始攻务=的顏繁哀英??//邊历革务觳据矣,対袞3矣适背觳??Regex?r=new?PvagexC9%^}?r??for?{±ziZ?±?=?0?z?i?<?Data?.Count;?i++》??
【参考文献】:
期刊论文
[1]改进的二分K均值聚类算法[J]. 刘广聪,黄婷婷,陈海南. 计算机应用与软件. 2015(02)
[2]基于关联矩阵的频繁项集挖掘算法[J]. 张雅芬,王新. 云南民族大学学报(自然科学版). 2012(02)
[3]基于自适应网格划分的数据流聚类算法[J]. 邢长征,张国凯. 计算机工程与科学. 2011(10)
[4]二分K均值聚类算法优化及并行化研究[J]. 张军伟,王念滨,黄少滨,蔄世明. 计算机工程. 2011(17)
[5]聚类算法及聚类融合算法研究[J]. 赵向梅,王艳君,刘林. 电子设计工程. 2011(15)
[6]关联规则在大学课程实验效果分析中的应用[J]. 张翔,董丽丽,王茹. 现代计算机(专业版). 2011(04)
[7]基于关联规则的购物篮分析[J]. 方玮玮. 四川理工学院学报(自然科学版). 2010(04)
[8]数据挖掘中关联规则算法的研究[J]. 程玉,熊英. 软件导刊. 2009(11)
[9]基于矩阵的模糊关联规则挖掘算法及其应用研究[J]. 李林,易云飞,黄潜,覃俊. 现代电子技术. 2009(20)
[10]基于数据挖掘技术的营销模式[J]. 吕佳,钱雪忠. 电脑知识与技术. 2009(03)
博士论文
[1]道路运输信息系统的数据挖掘方法研究与应用[D]. 郑晓峰.华南理工大学 2014
[2]可信关联规则挖掘算法研究[D]. 肖波.北京邮电大学 2009
硕士论文
[1]基于数据挖掘技术的医疗影像检查量预测[D]. 吴斌.杭州电子科技大学 2015
[2]大数据下粗糙关联规则算法研究[D]. 米允龙.昆明理工大学 2014
[3]云计算下的关联分析和模糊聚类研究[D]. 赵洪昌.南京信息工程大学 2013
[4]大规模数据挖掘聚类算法的研究与实现[D]. 崔日新.西安电子科技大学 2013
[5]不同结构多模型拟合方法研究[D]. 陈晓旭.西安电子科技大学 2013
[6]基于数据挖掘的保险展业系统设计[D]. 丁志宏.复旦大学 2011
[7]网络安全事件关联规则自动生成技术的研究与实现[D]. 李阳.国防科学技术大学 2010
[8]基于滑动窗口和子空间划分的数据流聚类算法研究[D]. 王浩.燕山大学 2010
[9]隐私保护分类数据挖掘研究[D]. 汤彪.内蒙古科技大学 2010
[10]复杂网络中的局部动力学模型[D]. 廖畅.上海交通大学 2010
本文编号:3251058
【文章来源】:湖北大学湖北省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
图2.1数据挖掘的基本步骤??
风险监控平台”后台数据库中,在GY市地方税务局下任意选取100个纳税人作为研??究样本,使用SQL语句将纳税人信息登记表以及从已缴税费表与应缴税费表中的重要??字段建立一个物化视图。由于篇幅有限,下
?是是?是??如下图3.5是Apriori算法实现流程图。在数据库中选取符合需求的样本数据,生成??候选数据集。在候选数据集中,根据最小支持度生成了满足条件的最大频繁项目集,将??生成的最大频繁集放到频繁集集合中。在频繁集中根据最小可信度产生强关联规则。??数荐庠候选数S集4生成频繁集一^成强关联规到'?■??图3.5?Apriori算法实现流程图??使用C#语言可以将Apriori算法移植进ASP.NET+Oracle的集合框架中,如图3.6是??项目中实现的核心代码,主要进行算法迭代,直至无法生成候选项目集。??//萁沄:s行迗代??Hs*c<Ite2TiSe*c>?Apridi?(AirrsylList;?Data?rArrsyiist;?AL?r?fIcat;?sup)??{??List;<It;emSet>?L?=?new?;//存鐘,§f有顏繁琪英??i?f?CAL.?Count?=?C?>?return?L;??else??{??im[]?Aiccuni:?=?new?:1二[5^.<^11111:];//扫_顼目矣#数蓉,德始化为<3??Ar2:syList?M^frs.quent?=?new?^rrsyList:?();//?〇始攻务=的顏繁哀英??//邊历革务觳据矣,対袞3矣适背觳??Regex?r=new?PvagexC9%^}?r??for?{±ziZ?±?=?0?z?i?<?Data?.Count;?i++》??
【参考文献】:
期刊论文
[1]改进的二分K均值聚类算法[J]. 刘广聪,黄婷婷,陈海南. 计算机应用与软件. 2015(02)
[2]基于关联矩阵的频繁项集挖掘算法[J]. 张雅芬,王新. 云南民族大学学报(自然科学版). 2012(02)
[3]基于自适应网格划分的数据流聚类算法[J]. 邢长征,张国凯. 计算机工程与科学. 2011(10)
[4]二分K均值聚类算法优化及并行化研究[J]. 张军伟,王念滨,黄少滨,蔄世明. 计算机工程. 2011(17)
[5]聚类算法及聚类融合算法研究[J]. 赵向梅,王艳君,刘林. 电子设计工程. 2011(15)
[6]关联规则在大学课程实验效果分析中的应用[J]. 张翔,董丽丽,王茹. 现代计算机(专业版). 2011(04)
[7]基于关联规则的购物篮分析[J]. 方玮玮. 四川理工学院学报(自然科学版). 2010(04)
[8]数据挖掘中关联规则算法的研究[J]. 程玉,熊英. 软件导刊. 2009(11)
[9]基于矩阵的模糊关联规则挖掘算法及其应用研究[J]. 李林,易云飞,黄潜,覃俊. 现代电子技术. 2009(20)
[10]基于数据挖掘技术的营销模式[J]. 吕佳,钱雪忠. 电脑知识与技术. 2009(03)
博士论文
[1]道路运输信息系统的数据挖掘方法研究与应用[D]. 郑晓峰.华南理工大学 2014
[2]可信关联规则挖掘算法研究[D]. 肖波.北京邮电大学 2009
硕士论文
[1]基于数据挖掘技术的医疗影像检查量预测[D]. 吴斌.杭州电子科技大学 2015
[2]大数据下粗糙关联规则算法研究[D]. 米允龙.昆明理工大学 2014
[3]云计算下的关联分析和模糊聚类研究[D]. 赵洪昌.南京信息工程大学 2013
[4]大规模数据挖掘聚类算法的研究与实现[D]. 崔日新.西安电子科技大学 2013
[5]不同结构多模型拟合方法研究[D]. 陈晓旭.西安电子科技大学 2013
[6]基于数据挖掘的保险展业系统设计[D]. 丁志宏.复旦大学 2011
[7]网络安全事件关联规则自动生成技术的研究与实现[D]. 李阳.国防科学技术大学 2010
[8]基于滑动窗口和子空间划分的数据流聚类算法研究[D]. 王浩.燕山大学 2010
[9]隐私保护分类数据挖掘研究[D]. 汤彪.内蒙古科技大学 2010
[10]复杂网络中的局部动力学模型[D]. 廖畅.上海交通大学 2010
本文编号:3251058
本文链接:https://www.wllwen.com/guanlilunwen/shuishoucaizhenglunwen/3251058.html