基于迭代式聚类的审计疑点发现——以上市公司财报数据为例
本文关键词:基于迭代式聚类的审计疑点发现——以上市公司财报数据为例
【摘要】:数据库查询技术作为目前计算机审计的主要方法,是一种通过审计人员先验知识发现审计疑点的方法。但当缺乏相关审计知识时,便难以给出从海量数据中发现疑点的方法。为破解这一难题,提出基于迭代式聚类的审计疑点发现方法。该方法可在无先验知识的情形下,通过对审计指标的分析,将与大多数被审计对象行为明显相异的少数对象自主识别为审计疑点。利用多种非结构化信息及网络爬取技术,从140份审计报告中自动提取出高频审计问题并据此选定财务指标;归集2008—2012年913家上市公司的财报数据,应用迭代式聚类方法,挖掘出68家疑点公司进行分析。并利用证监会等机构的非结构化网络信息,验证了此方法的有效性。验证结果表明:迭代式聚类方法有助于从海量数据中自主发现审计疑点,缩小疑点筛查范围,提高审计效率。
【作者单位】: 审计署计算机技术中心;
【关键词】: 计算机审计 聚类 审计疑点 海量数据
【基金】:国家科技支撑计划项目(项目批准号:2012BAH08B02) 国家自然科学基金项目(项目批准号:71272216) 教育部人文社会科学研究(项目批准号:13YJCZH143)联合资助
【分类号】:F239.6
【正文快照】: 一、引言随着信息化水平的不断提高,许多被审计单位的数据越来越呈现出海量化的趋势,不少单位已建立起TB甚至PB级的数据库(洪天一,2011)。面对海量数据如何实现“审计全覆盖”并从中发现疑点,充分发挥审计“免疫系统”功能,践行“总体分析、系统研究、发现疑点、分散核实、精
【参考文献】
中国期刊全文数据库 前5条
1 王伟钧;马晓凯;;基于证券行业半结构化数据的抽取技术[J];成都大学学报(自然科学版);2008年02期
2 曾德胜;彭灿明;陈源;张新林;;基于数据挖掘的审计系统研究[J];长春工程学院学报(自然科学版);2011年01期
3 方新丽;;浅议数据挖掘技术在计算机审计中的应用[J];电脑知识与技术;2013年15期
4 蒋超;;数据挖掘技术在计算机审计中的应用研究[J];中国管理信息化;2014年20期
5 应里孟;;计算机审计领域几个相关概念之辨析[J];中国农业会计;2013年06期
【共引文献】
中国期刊全文数据库 前10条
1 张莉;王璐;;资产负债表平行模拟审计数据分析模型[J];北京信息科技大学学报(自然科学版);2011年01期
2 王伟钧;袁正伟;谢文吉;杨晋浩;;股市K线组合的关联规则挖掘[J];成都大学学报(自然科学版);2009年03期
3 常启军;;计算机审计模式研究述评[J];财会通讯(学术版);2008年06期
4 孙良文;;基于Excel的审计数据挖掘方法与路径研究[J];财会通讯;2011年12期
5 曹顺良;宋静;李荣;雷向欣;;智能审计软件系统架构研究[J];财会通讯;2012年16期
6 朱政;刘侃;;孤立点分析在税务审计上的发展运用[J];硅谷;2012年19期
7 方新丽;;浅议数据挖掘技术在计算机审计中的应用[J];电脑知识与技术;2013年15期
8 文勇;;数据挖掘在风险导向审计中的应用[J];财会通讯;2013年13期
9 姜云飞;;基于聚类的博士生源选拔方法探析[J];长春大学学报;2014年02期
10 王瑞;费树岷;;基于数据挖掘的纺织企业成本预测[J];电脑知识与技术;2014年05期
中国博士学位论文全文数据库 前8条
1 陈洪顺;基于商业智能的财务审计信息系统研究[D];山东大学;2011年
2 董才林;我国商业银行稽核监管与电子化稽核研究[D];华中科技大学;2005年
3 杨欢;协议漏洞挖掘及Android平台恶意应用检测技术研究[D];西安电子科技大学;2014年
4 曾强;面向软件漏洞的挖掘方法研究[D];燕山大学;2014年
5 谢岳山;数据挖掘技术在联网审计中的应用研究[D];中南大学;2013年
6 郝连旺;基于多空间混合属性融合的白细胞图像识别方法研究[D];燕山大学;2014年
7 王云升;基于软件老化自适应的高可靠SaaS应用性能保障方法研究[D];东北大学;2011年
8 赵华;基于粗糙集理论的混合数据挖掘方法研究[D];西南交通大学;2014年
【二级参考文献】
中国期刊全文数据库 前10条
1 周正深;论金融电子化对金融审计的影响[J];商业研究;2000年09期
2 钱进,孟祥萍,徐冬寅;一种有效的关联规则增量式更新算法[J];长春工程学院学报(自然科学版);2003年03期
3 曾德胜;彭灿明;陈源;张新林;;基于数据挖掘的审计系统研究[J];长春工程学院学报(自然科学版);2011年01期
4 陈寿文;李明东;;基于面向对象思想KMeans算法实现[J];滁州学院学报;2008年03期
5 杨明,杨萍,吉根林,孙志挥;一种基于关联规则的缺省规则挖掘算法[J];东南大学学报(自然科学版);2003年06期
6 谢羽霄;邱晨旭;;基于COBIT框架的电信企业信息技术内部控制体系研究[J];电信科学;2009年07期
7 黄文;;决策树的经典算法:ID3与C4.5[J];四川文理学院学报;2007年05期
8 黄修丹;数据挖掘领域中的聚类分析及应用[J];闽江学院学报;2004年05期
9 牛丽敏;;Apriori算法分析与改进综述[J];桂林电子科技大学学报;2007年01期
10 陈乃激;;基于财务分析的数据挖掘技术[J];中国管理信息化;2008年09期
【相似文献】
中国期刊全文数据库 前2条
1 金丹;秦秋平;;迭代式开发多Agent系统的研究[J];科技经济市场;2006年05期
2 ;[J];;年期
中国硕士学位论文全文数据库 前2条
1 王永锋;迭代式开发在手机人机界面开发中的应用[D];西安电子科技大学;2008年
2 张桐;基于模型融合的迭代式分布式聚类框架的设计与实现[D];天津大学;2012年
,本文编号:769834
本文链接:https://www.wllwen.com/jingjilunwen/sjlw/769834.html