当前位置:主页 > 硕博论文 > 经管硕士论文 >

文本与财务数据相结合的上市公司财务风险预测

发布时间:2020-11-17 17:24
   随着我国经济的飞速发展,以上市公司为主的金融市场规模也在不断增加。在金融市场的海洋中,暗礁无处不在,其中财务风险是上市公司不可避免的难题。当公司陷入财务风险时,不仅上市公司本身的价值会被削弱,还会对公司未来的发展前景产生较严重的影响。在此背景下,如何准确预测财务风险是上市公司和投资者都十分关心的问题,对于保障各方的利益,以及维护金融市场的稳定具有重要意义。对上市公司来说,准确预测财务风险可以避免陷入财务危机,加强市场对公司的信心,促进企业更加高速地发展。对投资者来说,上市公司的财务状况直接关系到投资者的收益,如果能够预测到公司未来的财务风险,投资者就可以避免因上市公司陷入财务风险而导致自身过大的损失,及时止损。在财务会计领域,在财务风险的预测上已经做了许多工作。通常分析上市公司的三大财务报表中的重要财务指标来反映一个企业是否陷入财务风险,或者使用不同方法对各大财务指标进行处理,例如比率分析法等。用处理之后的财务指标进行预测分析,又或者使用财务指标代入不同领域的方法模型中对财务风险进行预测,例如SVM、决策树等。但是在以往的论文中,大部分的工作主要是使用公司年度报告中的结构化数据(即财务指标)来构建上市企业财务风险预测模型,我们分析认为仅考虑财务指标数据是不全面的,忽视了财务文本的作用,是不合理的,因为财务文本中蕴含大量未发掘的、对于预测财务风险有帮助的内在信息。本论文投资方的视角去研究上市公司的财务风险模型。我们基于上市公司年报中的信息来预测公司的财务风险。具体来说,本文提取上市公司年报中的结构化财务数据(以下简称财务数据)和非结构化财务文本(以下简称财务文本)来进行财务风险预测。论文提出了三种模型,第一种模型使用财务数据分别采用CNN模型、SVM和XGBoost进行建模,第二种模型使用财务文本采用LSTM+注意力机制进行建模,第三种模型将财务数据与财务文本结合起来建模。在第三种模型中我们尝试使用了两种网络结构,一种由CNN卷积神经网络和LSTM长短期记忆神经网络组成,另一种由单隐层前馈神经网络和LSTM长短期记忆神经网络组成。实验结果显示,非结构化财务文本中包含了重要信息,但是单独使用财务文本来预测财务风险效果不佳,而在基于财务数据的模型中加入文本能显著提高财务风险预测的准确性。此外,财务文本可以有多种方式与财务数据相结合,不同的结合方法,以及不同的财务数据特征提取方法都会对模型性能产生影响。本文的研究证实了上市公司报告中的文本具有重要的研究价值,对于财务风险预测也提供了新的思路,研究成果对于投资者和企业管理者有重要的参考价值。
【学位单位】:江西财经大学
【学位级别】:硕士
【学位年份】:2020
【中图分类】:F832.51;F275
【部分图文】:

年报,财务,公司


文本与财务数据相结合的上市公司财务风险预测2十二大章节构成。如图1-1所示。图1-1年报构成年报中较为重要的章节有“第二节公司简介和主要财务指标”、“第四节经营情况讨论与分析”、“第五节重要事项”、“第十一节财务报告”等几大章节。其中“第二节公司简介和主要财务指标”主要是公司过去一年的财务报表数据的披露,用数据反映了过去一年公司的财务经营状况。“第四节经营情况讨论与分析”主要分析上市公司的经营情况、经营模式以及经营策略等,是对过去一年经营情况整体情况的汇报总结,以及对未来经营方向等方面的一个概述。“第五节重要事项”主要是反映过去一年上市公司需要特殊说明的事项,主要包括:重大诉讼,公司、公司董事以及高级管理人员受处罚情况,股东变更,

超平面


文本与财务数据相结合的上市公司财务风险预测102.1.1支持向量机支持向量机(SVM)模型是一种针对带标签数据集可以被线性分开所提出的分类模型,即对已有类别标签的数据进行二分类监督学习(supervisedlearning)的广义线性分类器(generalizedlinearclassifier),其算法原理是依据有类别标签的数据集来求解最大边距超平面(maximum-marginhyperplane),从而以超平面为分割线,确立不同类别的有效区域。SVM分类中的其主要困难是确定能够正确划分带分类标签数据的几何分离超平面。分类的准确率高低以及模型的好坏,取决于超平面的优劣。如下图2-1所示。图2-1超平面划分图例如,假定现有数据集D={(1,1),(2,2),(31,3),…,(,)},∈{-1,1},我们希望能在样本空间找一个很好的区分平面,但是能将样本区分的超平面并不是唯一的,如图2-1所示,P1、P2、P3都能区分样本。那么应该取哪个呢?直观的看,应该寻找位于两类带标签样本“正中间”的划分超平面。即P2,因为P2对样本数据局部扰动的“容忍性”最好。例如,当训练数据拥有噪声时,P2所受的干扰最小,因为它距离超平面两边的样例的距离都相对较远。换句话说,P2所产生的分类结果是最好的。对未出现在训练集中的数据的泛化能力最强。在样本空间,划分样本数据的超平面可以通过下列线性方程描述:+=0(2.1)

模型图,支持向量,超平面,数据空间


第二章相关理论与技术简介11其中=(1;2;3;…;)为法向量,决定了超平面的方向。为位移项,决定了超平面与原点的距离。很显然,超平面可以由法向量与位移项确定。我们将超平面记为(,),则样本空间里面的样本点到超平面(,)的距离可以有计算出来,即:=|+|‖‖(2.2)假设超平面(,)能将训练数据集进行正确分类,即对于(,)∈D,若=+1,则有+>0,若=-1,则有+<0,即:{+≥+1,=+1+≤1,=1(2.3)如图2-2所示,距离超平面最近的一些训练数据点使式(2.3)等号成立。这些训练样本点被称为“支持向量”(supportvector),两个不同类别的支持向量到超平面的距离之和为:=2‖‖(2.4)公式(2.4)被称为“间隔”(margin)。图2-2支持向量的定义SVM模型就是想要去在数据空间中找出是所有数据能“最大间隔”的超平面(,),换句话说就是要找出能满足式子(2.3)中的两大约束条件和,使
【参考文献】

相关期刊论文 前5条

1 蔡秋童;何宗祥;;企业财务数据的决策模型分析[J];安徽师范大学学报(自然科学版);2015年05期

2 谢德仁;林乐;;管理层语调能预示公司未来业绩吗?——基于我国上市公司年度业绩说明会的文本分析[J];会计研究;2015年02期

3 刘丹;郭蕾;;A汽车股份有限公司财务报表分析[J];现代经济信息;2015年03期

4 李建平;李刚;丰吉闯;李铭禄;;证券公司整体风险的度量方法与实证[J];系统工程理论与实践;2012年03期

5 包媚娇;;新准则下长期资产减值不得转回对ST公司的影响初探[J];现代经济(现代物业下半月刊);2008年11期


相关博士学位论文 前1条

1 刘赫;文本分类中若干问题研究[D];吉林大学;2009年


相关硕士学位论文 前10条

1 戴伟达;基于全卷积神经网络的语义分割算法研究[D];南京邮电大学;2019年

2 王霄;基于SVM的沪深300指数量化择时策略实证研究[D];兰州大学;2019年

3 王静;上市交通运输企业财务风险预测研究[D];中国民航大学;2019年

4 马旭辉;基于机器学习的上市公司财务风险智能识别研究[D];南京大学;2019年

5 葛丹妮;基于注意力机制的特征选择:一种面向海量复杂数据的高效架构[D];浙江理工大学;2019年

6 贺琳;基于PCA-BP和SVM的上市公司财务风险预测研究[D];西安工程大学;2018年

7 刘阳;基于SVM的信息服务业上市公司财务风险预测研究[D];华中师范大学;2017年

8 冯珍慧;基于粒子群优化BP神经网络的上市公司财务风险预测研究[D];东华大学;2017年

9 罗旻婧;基于时间序列的财务风险预测研究[D];广东财经大学;2016年

10 易可欣;基于贝叶斯网络的信息产业财务风险预测研究[D];湖南大学;2016年



本文编号:2887748

资料下载
论文发表

本文链接:https://www.wllwen.com/shoufeilunwen/jjglss/2887748.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户167f0***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com