当前位置:主页 > 经济论文 > 股票论文 >

基于数据挖掘技术的上市公司财务舞弊识别研究

发布时间:2018-04-23 18:59

  本文选题:财务舞弊识别 + 数据挖掘 ; 参考:《杭州电子科技大学》2013年硕士论文


【摘要】:进入21世纪以来,世界各国的上市公司数量都在飞速增长。以A股为例,从2002年到2012年这十年间,A股的上市公司数量从1138家增长到2472家,翻了一倍。在这些成功上市或正准备上市的公司中,大多数都是希望通过上市的方式来获得更多的社会资源并最终以此提高自己在整个市场中的竞争力,但是也有部分公司因为各种各样的动机通过财务舞弊来谋取一些不正当的利益。这部分上市公司的财务舞弊行为对证券市场的各个参与者都有着重大影响。对于投资者来说,如果根据存在舞弊迹象的财务报告对相关上市公司做出了错误的投资,势必会造成损失。对于监管层来说,保证公开透明的证券市场环境是其本职工作,若对舞弊行为不加以制止,则会降低证券市场的资源配置效率甚至会造成证券市场的混乱。对于其他相关者,虚假的财务报告会使得利益相关者无法准确清晰的了解公司实际经营状况进而无法做出正确决策。正因如此,研究出能够有效识别上市公司财务舞弊行为的方法就变得很有实际意义。 本文在对上市公司财务舞弊相关理论深入理解的基础上,综合利用数据挖掘技术对2000-2008年的有舞弊迹象的上市公司及相应的控制样本建立模型。本文的研究成果体现在两个方面,一方面是通过特征选择结果得出对上市公司舞弊行为影响最大的几个指标,从而根据这几大指标对如何防止舞弊提出相应的建议;另一方面是通过对备选模型的建模效果进行比较,找出最适合这一问题的模型。论文的思路如下: 首先,阐述财务舞弊的概念和动因、数据挖掘的产生背景等相关理论,并对文章所使用的数据挖掘工具R语言进行了介绍。 然后,结合财务舞弊动因理论,初选了22个与财务舞弊行为相关的指标。通过Relief和信息增益这两种特征选择算法对2000-2008年的舞弊公司与控制样本进行指标筛选。综合两种特征选择算法的结果,对财务舞弊行为影响最大的几个指标分别为资产负债率、资产报酬率、应收账款周转率、销售期间费用率和流动资产周转率。 其次,经过Relief和信息增益两种特征选择算法筛选后的指标组合与未经指标筛选的原22个指标组合总共形成了三个数据集。将这三个数据集与最近邻、朴素贝叶斯和随机森林这3种具有代表性的数据挖掘算法相结合建立模型。在多种评价方法评价之后,发现预测效果最优的为经过信息增益算法筛选后的指标组合与最近邻算法结合的模型。 再次,考虑到所得的信息增益与最近邻算法结合的模型在舞弊公司的查全率上依然不尽如人意。将代价敏感学习引入到模型组合中,并提出了一种基于代价敏感学习的随机森林算法。该算法在测试集的舞弊公司查全率上达到89%,大大提高了整个舞弊识别模型的效果。 最后,结论部分从经过特征选择选择后的指标和模型应用两方面对全文进行了总结,,并对进一步规范我国上市公司的行为给出了一定的建议。
[Abstract]:Since twenty-first Century, the number of Listed Companies in the world has been growing rapidly. In the ten years from 2002 to 2012, for example, the number of Listed Companies in A shares has doubled from 1138 to 2472, doubling the number of companies that have successfully listed or are ready to go on the market, most of which are expected to get more by the way of listing. Social resources and ultimately improve their competitiveness in the whole market, but there are also some companies who make some unjustified interests through financial fraud for all kinds of motives. The financial fraud of this part of the listed company has a significant impact on the various participants in the stock market. For investors, if According to the financial reports of the signs of fraud, they make the wrong investment to the related listed companies. It is bound to cause loss. For the regulators, it is its job to ensure the open and transparent securities market environment. If the fraud is not stopped, it will reduce the efficiency of the resource allocation of the stock market and even cause the mix of the stock market. For others, false financial reports can make it impossible for the stakeholders to understand the actual situation of the company and make the right decision.
On the basis of in-depth understanding of the related theories of financial fraud of listed companies, this paper makes a comprehensive use of data mining technology to set up a model for 2000-2008 years of listed companies with signs of fraud and corresponding control samples. The research results of this paper are embodied in two aspects, on the one hand, through the results of characteristic selection, the fraud of the listed companies is obtained. In order to influence the most important indexes, the corresponding suggestions on how to prevent fraud are put forward according to these major indexes; on the other hand, by comparing the modeling effect of the alternative model, the model which is most suitable for this problem is found.
First, it expounds the concept and motivation of financial fraud, the background of data mining and other related theories, and introduces the data mining tool R language used in the article.
Then, combined with the theory of financial fraud motivation, 22 indexes related to financial fraud are selected. Through the two characteristic selection algorithms of Relief and information gain, 2000-2008 years of fraud companies and control samples are selected. The results of comprehensive two feature selection algorithms have the greatest impact on financial frauds. It should not be assets liability ratio, assets return rate, accounts receivable turnover rate, sales period cost rate and current assets turnover rate.
Secondly, a total of three data sets are formed by the combination of two feature selection algorithms selected by the Relief and information gain selection algorithm and the original 22 index combinations without index selection. The three data sets are combined with the nearest neighbor, simple Bias and random forest, which are combined with 3 representative data mining algorithms to establish a model. After the evaluation of the price method, it is found that the best prediction result is the combination of the index combination and the nearest neighbor algorithm after the information gain algorithm is selected.
Thirdly, considering the information gain combined with the nearest neighbor algorithm is still unsatisfactory in the recall company's recall rate, the cost sensitive learning is introduced into the model combination, and a stochastic forest algorithm based on cost sensitive learning is proposed. The algorithm has reached 89% on the recall rate of the fraud company of the test set, which is greatly raised. The effect of the entire fraud identification model is higher.
Finally, the conclusion is summed up in the conclusion of the full text from two parties after the selection of features and models, and gives some suggestions for further standardizing the behavior of the listed companies in China.

【学位授予单位】:杭州电子科技大学
【学位级别】:硕士
【学位授予年份】:2013
【分类号】:F275;F224;F276.6

【相似文献】

相关期刊论文 前10条

1 黄新建;;中国上市公司财务舞弊方式及对策研究[J];经济经纬;2006年04期

2 黄新建;李若山;;中国上市公司财务舞弊成因分析[J];生产力研究;2006年08期

3 徐文丽;;上市公司财务舞弊与企业内部控制研究[J];山西大学学报(哲学社会科学版);2007年04期

4 明洪盛;;财务报表舞弊的表现方式与形成原因分析[J];科技创业月刊;2007年09期

5 黄新建;吴江;付利;;治理中国上市公司财务舞弊行为的对策研究[J];生产力研究;2007年15期

6 张佩;;基于博弈论的上市公司财务舞弊行为分析[J];黑龙江科技信息;2009年09期

7 李永泉;李婧华;;上市公司财务舞弊手段及其对策研究[J];科技咨询导报;2007年18期

8 闫俊瑜;;上市公司财务舞弊行为刍议[J];山西财政税务专科学校学报;2009年02期

9 田亚平;;基于信号识别的财务舞弊研究[J];中国集体经济;2011年18期

10 姚烽;;浅析财务舞弊的鉴别[J];海峡科学;2007年10期

相关会议论文 前10条

1 廖雪洁;刘汉民;;垄断国企高管薪酬现状分析——基于我国上市公司的数据[A];第五届(2010)中国管理学年会——公司治理分会场论文集[C];2010年

2 叶华;;上市公司财务信息披露及时性研究——基于我国上市公司数据的实证分析[A];中国会计学会财务管理专业委员会2009年学术年会论文集[C];2009年

3 刘瑞武;余漱峰;;基于因特网的上市公司投资者关系管理[A];第九届全国会计信息化年会论文集(上)[C];2010年

4 黄少安;钟卫东;;股权融资成本软约束假说与股权融资偏好——对中国公司股权融资偏好的进一步解释[A];2010年(第十届)中国制度经济学年会论文集[C];2010年

5 曹汛;;浅谈上市公司的内部审计[A];对外经贸财会论文选第十五辑[C];2003年

6 浙江省内审协会课题组;;上市公司内部审计研究[A];石油杯全国上市公司内部审计理论研讨会暨经验交流论文汇编[C];2003年

7 ;上市公司内审工作的思考[A];石油杯全国上市公司内部审计理论研讨会暨经验交流论文汇编[C];2003年

8 金山;陈盈如;;上市公司并购重组中法律与财务会计对接评析[A];第三届中国律师论坛论文集(实务卷)[C];2003年

9 徐向艺;陈振华;马磊;;上市公司关联交易的经济学分析及其规制[A];中国工业经济研究与开发促进会2005年会暨“产业组织与政府规制”研讨会论文集[C];2005年

10 何丽梅;刘晓春;;股权分置改革对上市公司财务管理目标的影响分析[A];中国会计学会高等工科院校分会2005年学术年会暨第十二届年会论文集[C];2005年

相关重要报纸文章 前10条

1 本版编辑 证券时报记者  陈霞 何雨华 申草 晓河;证券市场的“第四只眼”[N];证券时报;2006年

2 钟君君;做“熊市终结者”[N];第一财经日报;2006年

3 王大力;上市公司2005年度十大现金舞弊排行榜[N];第一财经日报;2006年

4 驻京记者 宋华;业界人士热议“申草现象”[N];深圳商报;2006年

5 证券时报两会报道组;加强对上市公司大股东和高管监管[N];证券时报;2008年

6 徐晓巍;夏草 无奈的“财务杀手”[N];中国证券报;2008年

7 陈蓉;夏草:除非澄清,否则我不会停止揭黑[N];证券日报;2008年

8 谢岚;财政部会计司司长:夏草所述情况皆在掌握中[N];证券日报;2008年

9 侯捷宁;对上市公司财务舞弊等行为将依法严肃处理[N];证券日报;2008年

10 冯玉华 执笔:程才良 温科银;全流通时代大股东行为及监管对策研究[N];上海证券报;2006年

相关博士学位论文 前10条

1 潘丽春;中国上市公司并购价值影响因素和演进路径的实证研究[D];浙江大学;2005年

2 巩娜;上市公司管理者股权激励研究[D];吉林大学;2009年

3 梦然;公司法人治理结构研究[D];南京理工大学;2002年

4 何旭;上市公司股权结构与经营绩效研究[D];东北林业大学;2003年

5 李绪富;我国上市公司重塑研究[D];复旦大学;2003年

6 吴琳芳;中国上市公司会计信息披露研究[D];西北农林科技大学;2004年

7 杨柏;上市公司信息披露监控机制研究[D];重庆大学;2004年

8 李丹;我国上市公司发展规模的实证研究[D];华中科技大学;2004年

9 李清;我国上市公司盈余管理的理论与实证研究[D];武汉理工大学;2008年

10 杜晓宇;中国上市公司高管变更期间业绩预告披露行为研究[D];吉林大学;2009年

相关硕士学位论文 前10条

1 赵功;上市公司财务舞弊手段及成因分析[D];云南大学;2012年

2 贺颖;基于偏最小二乘法—支持向量机的上市公司财务舞弊识别模型研究[D];石河子大学;2010年

3 李臣臣;基于数据挖掘的上市公司财务舞弊的关联规则研究[D];吉林大学;2011年

4 贺金玲;我国上市公司董事会特征与会计信息披露质量的实证研究[D];西南财经大学;2011年

5 朱玲;上市公司财务舞弊行为研究[D];华中科技大学;2007年

6 姚致萱;决策树技术在上市公司财务报告舞弊识别中的应用研究[D];天津财经大学;2010年

7 蒋妍;我国上市公司财务舞弊治理研究[D];黑龙江八一农垦大学;2008年

8 于慧琴;我国上市公司财务舞弊问题研究[D];南京理工大学;2008年

9 富国海;我国上市公司财务舞弊成因及治理研究[D];东北财经大学;2007年

10 韩笑;股权分置改革后我国上市公司现金股利分配与公司绩效的实证分析[D];东北财经大学;2011年



本文编号:1793199

资料下载
论文发表

本文链接:https://www.wllwen.com/jingjilunwen/jinrongzhengquanlunwen/1793199.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4e2df***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com