基于情感分析的上市公司年报舞弊预警研究
发布时间:2021-08-14 21:38
上市公司年度报告作为反映企业经营情况的权威发布文件,相比于其他舆论信息更加正式,给读者带来视觉匿名感,内含大量的主观性文本。主观性文本内容可操纵性强,在描述时可能存在过度美化、避重就轻等情况,在实际监管中,如果管理者有意隐瞒或会计作假,在文本部分可能存在异于往常的情感变化,将在一定程度上误导投资者的决策判断。因此,对这部分文本进行情感分析,对于触发财务审计具有很好的预警作用。由于文本的非结构化特性,分析难度更大,财务审计人员使用常规的分析方法不能准确的挖掘文本信息。因此,本文以年报为研究对象,利用人工智能技术挖掘披露报告的情感信息,探究其在舞弊检测方面的影响。具体研究内容如下:(1)基于语义的上市公司年报文本情感分析研究。该研究结合语料库和知识库的特点,借助通用情感词典自动标引训练语料,利用词向量的方法判别报告中候选情感词的极性,结合权威的金融词典构建了面向年报的中文情感词典,通过匹配语义规则实现篇章级年报文本的情感分析。(2)基于深度学习的细粒度年报文本情感分析研究。该研究采用人工标注的数据集,引入BERT预训练模型实现年报文本句子的向量化表达,以解决目前其他语言模型不能有效考虑上下...
【文章来源】:东北林业大学黑龙江省 211工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2-1网络爬虫的一般流程??
句子B,通过模型训练来判定句子B是否是句子A的下一??句。训练过程如下:??(1)利用预训练的语料构造训练集,其中50%的样本,句子A和句子B是上下文的??关系,将这类样本标签记为“IsNext”。??(2)另外50%的样本,句子B是随机从语料库中抽取的,与A无上下文关系,将这??类样本标签记为“NotNext”。??(3)将句子A与句子B拼接后输入预训练的模型,利用“[CLS]”标记每一次输入的??样本,最后利用[CLS]对应的输出向量来预测标签的类别。??BERT模型的结构如图2-3所示。??Tl?丁2?...?Tn??Transformer?Transfomier?...?Transformer??Transformer?Transformer?…?Transformer??E.?E:?…?En??图2-3?BERT预训练语言模型【42]??BERT模型采用双向Transformer作为特征抽取器,通过查询字向量表将文本的每个字??符转换为向量作为模型的输入,输入字符对应的融合全文语义信息后的向量表示则为模型的??输出。特别的是,BERT模型的输入除了字符向量(Token?Embeddings)还包括文本向量??-12-??
d&Norm?—??"?I?I??x.?,?"?j^f?Masked?^??MAUl"-Head?Mulf-Head??Attention?A??、?Attention?^??-??J?L?/??Positional?^?4?Positional??Econding?W?Econding??^?Input?Embedding〕?^?Output?Embedding??^r^.’?————「:??Inputs?Outputs??图24?Transformer模型结构图??作为-种双向模型,Transformer的编码器摒弃了传统的CNN和RNN的祌经网络结??构,仅使用自注意力机制,能够一次性地从前往后或者从后往前来获取输入义本序列的所冇??信息。Transformer的网络结构特征使得模型可以利用某一词周围的所冇文木农进行丨:K文??的学习可并行捕获长距离依赖关系,且运算速度快。??由于生成语言模型并不需要Transformer中解H器的部分,闪此BERT模型进行语言建??模只需要Transformer中作为特征抽取器的编朽部分,由多个Transformer模型的编码器结??构堆叠形成。Transformer的编码器部分将字符向量和位置向量直接加和作为输入,经过多??-13-??
【参考文献】:
期刊论文
[1]基于深度学习的APP-Store评论情感分析[J]. 李鑫,李晓戈. 计算机与数字工程. 2019(10)
[2]基于情感词典的课程评论情感分析[J]. 胡荣,崔荣一,赵亚慧. 延边大学学报(自然科学版). 2019(02)
[3]基于深度学习的中英文混合短文本情感分析[J]. 龚泽阳,徐华韫,何正杰,崔金真,吴珂. 信息与电脑(理论版). 2019(05)
[4]基于机器学习与情感词典的文本主题概括及情感分析[J]. 宋祖康,阎瑞霞,辜丽琼. 软件导刊. 2019(04)
[5]基于深度神经网络和LSTM的文本情感分析[J]. 王子牛,吴建华,高建瓴,陈娅先,王许. 软件. 2018(12)
[6]基于CNN和BiLSTM网络特征融合的文本情感分析[J]. 李洋,董红斌. 计算机应用. 2018(11)
[7]基于卷积神经网络与多特征融合的Twitter情感分类方法[J]. 王汝娇,姬东鸿. 计算机工程. 2018(02)
[8]细粒度情感分析研究综述[J]. 唐晓波,刘广超. 图书情报工作. 2017(05)
[9]会计舞弊的财务预警分析[J]. 罗昕炜,彭茜. 行政事业资产与财务. 2017(10)
[10]常用中文分词软件在中医文本文献研究领域的适用性研究[J]. 杨海丰,陈明亮,赵臻. 世界科学技术-中医药现代化. 2017(03)
硕士论文
[1]基于情感分析的旅游景点推荐[D]. 何雪琴.新疆大学 2019
[2]基于域对抗网络的跨领域文本情感分析[D]. 林强.桂林电子科技大学 2019
[3]产品评论文本的情感分析方法研究[D]. 原多多.兰州财经大学 2019
[4]管理层讨论与分析的语言特征和企业未来业绩关系研究[D]. 李胜男.哈尔滨工业大学 2018
[5]情感分析方法在金融语料库中的应用[D]. 张道玲.暨南大学 2018
[6]词向量的改进及其在作品风格识别中的应用[D]. 王贺.大连理工大学 2018
[7]企业财务舞弊特征与审计方法研究[D]. 龙凤.西南财经大学 2012
本文编号:3343231
【文章来源】:东北林业大学黑龙江省 211工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【部分图文】:
图2-1网络爬虫的一般流程??
句子B,通过模型训练来判定句子B是否是句子A的下一??句。训练过程如下:??(1)利用预训练的语料构造训练集,其中50%的样本,句子A和句子B是上下文的??关系,将这类样本标签记为“IsNext”。??(2)另外50%的样本,句子B是随机从语料库中抽取的,与A无上下文关系,将这??类样本标签记为“NotNext”。??(3)将句子A与句子B拼接后输入预训练的模型,利用“[CLS]”标记每一次输入的??样本,最后利用[CLS]对应的输出向量来预测标签的类别。??BERT模型的结构如图2-3所示。??Tl?丁2?...?Tn??Transformer?Transfomier?...?Transformer??Transformer?Transformer?…?Transformer??E.?E:?…?En??图2-3?BERT预训练语言模型【42]??BERT模型采用双向Transformer作为特征抽取器,通过查询字向量表将文本的每个字??符转换为向量作为模型的输入,输入字符对应的融合全文语义信息后的向量表示则为模型的??输出。特别的是,BERT模型的输入除了字符向量(Token?Embeddings)还包括文本向量??-12-??
d&Norm?—??"?I?I??x.?,?"?j^f?Masked?^??MAUl"-Head?Mulf-Head??Attention?A??、?Attention?^??-??J?L?/??Positional?^?4?Positional??Econding?W?Econding??^?Input?Embedding〕?^?Output?Embedding??^r^.’?————「:??Inputs?Outputs??图24?Transformer模型结构图??作为-种双向模型,Transformer的编码器摒弃了传统的CNN和RNN的祌经网络结??构,仅使用自注意力机制,能够一次性地从前往后或者从后往前来获取输入义本序列的所冇??信息。Transformer的网络结构特征使得模型可以利用某一词周围的所冇文木农进行丨:K文??的学习可并行捕获长距离依赖关系,且运算速度快。??由于生成语言模型并不需要Transformer中解H器的部分,闪此BERT模型进行语言建??模只需要Transformer中作为特征抽取器的编朽部分,由多个Transformer模型的编码器结??构堆叠形成。Transformer的编码器部分将字符向量和位置向量直接加和作为输入,经过多??-13-??
【参考文献】:
期刊论文
[1]基于深度学习的APP-Store评论情感分析[J]. 李鑫,李晓戈. 计算机与数字工程. 2019(10)
[2]基于情感词典的课程评论情感分析[J]. 胡荣,崔荣一,赵亚慧. 延边大学学报(自然科学版). 2019(02)
[3]基于深度学习的中英文混合短文本情感分析[J]. 龚泽阳,徐华韫,何正杰,崔金真,吴珂. 信息与电脑(理论版). 2019(05)
[4]基于机器学习与情感词典的文本主题概括及情感分析[J]. 宋祖康,阎瑞霞,辜丽琼. 软件导刊. 2019(04)
[5]基于深度神经网络和LSTM的文本情感分析[J]. 王子牛,吴建华,高建瓴,陈娅先,王许. 软件. 2018(12)
[6]基于CNN和BiLSTM网络特征融合的文本情感分析[J]. 李洋,董红斌. 计算机应用. 2018(11)
[7]基于卷积神经网络与多特征融合的Twitter情感分类方法[J]. 王汝娇,姬东鸿. 计算机工程. 2018(02)
[8]细粒度情感分析研究综述[J]. 唐晓波,刘广超. 图书情报工作. 2017(05)
[9]会计舞弊的财务预警分析[J]. 罗昕炜,彭茜. 行政事业资产与财务. 2017(10)
[10]常用中文分词软件在中医文本文献研究领域的适用性研究[J]. 杨海丰,陈明亮,赵臻. 世界科学技术-中医药现代化. 2017(03)
硕士论文
[1]基于情感分析的旅游景点推荐[D]. 何雪琴.新疆大学 2019
[2]基于域对抗网络的跨领域文本情感分析[D]. 林强.桂林电子科技大学 2019
[3]产品评论文本的情感分析方法研究[D]. 原多多.兰州财经大学 2019
[4]管理层讨论与分析的语言特征和企业未来业绩关系研究[D]. 李胜男.哈尔滨工业大学 2018
[5]情感分析方法在金融语料库中的应用[D]. 张道玲.暨南大学 2018
[6]词向量的改进及其在作品风格识别中的应用[D]. 王贺.大连理工大学 2018
[7]企业财务舞弊特征与审计方法研究[D]. 龙凤.西南财经大学 2012
本文编号:3343231
本文链接:https://www.wllwen.com/guanlilunwen/bankxd/3343231.html