基于计算智能的金融数据异常发现
发布时间:2020-04-07 04:14
【摘要】:21世纪,金融无疑是现代经济的核心。金融业的健康发展,是经济持续增长、社会稳定发展的必然要求。探索金融市场瞬息万变中所隐含的规律,从而有效管理金融市场,提高金融业投资效率,是各级政府及投资机构的主要目标之一。但是,近年来金融行业不断出现的异常现象,例如保险与信贷欺诈,洗钱活动,会计信息造假等(负性异常),严重损害了金融业的健康发展和广大人民的利益。因此,加强金融行业的监管,及时识别、防范此类异常现象的发生,具有重要的现实意义。另外,对于金融投资机构或个人投资者来说,研究金融行业中的另一种异常现象—价格趋势发生反转的拐点(正性异常),也具有重要的投资意义。 本文在学习研究相关文献的基础上,发掘新思路,应用计算智能理论进行金融领域的两类异常现象的发现研究,为相关部门或个人提供决策参考。对于金融领域的负性异常现象,选用来自UCI的信贷数据进行相关研究;对于金融领域的正性异常现象,选用股票数据进行相关研究。 关于这两个数据集,现有研究情况如下: (1)关于信贷数据集的研究,目前的文献主要是将其作为实验数据来验证分类算法的有效性,没能从信贷数据本身的特征出发进行研究,因此难以给相关部门提供决策参考。 (2)现有的关于股市异常的实证研究,主要是提出一种新的异常发现算法,然后将股票数据作为一个实验数据集来验证算法;或者只是研究了股市发生异常前后的特征,还没能将这种发现的特征量化以预测异常现象;或者所定义的异常点对于现实决策的参考意义不是很大。 本文针对以上不足,做了以下研究: (1)对于信贷数据集,首先应用粗糙集理论进行特征选择,得到一个约简后的特征子集;然后应用贝叶斯理论进行分析,以发现易导致信贷异常发生的特征;最后应用朴素贝叶斯分类器进行分类研究,并改进算法进一步提高异常信贷的正确识别率。 (2)对上证A股银行类个股数据进行异常发现研究。首先收集并整理相关数据;然后根据股市技术分析的相关理论,通过分析个股后市的发展趋势,定义一种新的异常点:买点或卖点—后市股价将有大幅上升或下降的时间点,并根据异常点的定义发现股价序列中的异常点;最后根据研究需要,将数据根据日均成交金额分成两组,并分组训练基于F-score的SVM分类模型。实验证明,利用SVM分类器进行异常识别研究,可以取得较好的结果;而且成交活跃的第二组数据的实验结果明显优于成交不够活跃的第一组数据:分类准确率可以达到80%左右,正异常数据(买点)的正确识别率达到79%,负异常数据(卖点)的正确识别率达到75.56%。
【图文】:
⑧缨回杏嗀....一..…,.引.一一田溉出一,
本文编号:2617434
【图文】:
⑧缨回杏嗀....一..…,.引.一一田溉出一,
本文编号:2617434
本文链接:https://www.wllwen.com/guanlilunwen/bankxd/2617434.html