基于广义Rescal分解的股票缺失值填充
发布时间:2023-02-19 13:51
张量是高维数据的自然存储形式,它能够有效的保留原始的数据结构,使用张量进行数据挖掘工作,结果具有更高的准确度。张量是深度学习领域的基本数据结构,同时也是构建关系数据模型的主要工具。关系模型是目前比较热门的研究领域,亦是知识图谱、推荐算法等应用方向的基础。本文将张量分解应用到关系模型领域。在关系模型中,Rescal分解是一种插补准确度高,且比CP分解更具解释性的分解算法。过去研究的关系通常是0-1的二元关系,而本文提出了一种基于广义关系(离散的、连续的)的Rescal分解,使用交替最小二乘算法进行迭代拟合。生成了仿真数据,从秩的选择、初始化方法和原始Rescal三个方面进行了对比,研究发现,广义损失函数的拟合效果与二次损失函数的拟合效果整体相当,但从可解释角度来看,广义方法更贴合数据的实际特征。最后,本文将提出的广义分解方法,简单应用到了股票市场。希望通过股票之间关系来填充由于股票停牌而无法计算的对数收益率相关系数。结果表明了填充方式的合理可行性,结果也与实际情况相符合,但由于样本数据量小,填充结果的精度不一定高,可能存在浮动区间。基于缺失相关系数的结果,可用于一些金融模型,帮助投资者做...
【文章页数】:64 页
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究内容与方法
1.2.1 研究内容
1.2.2 研究方法
1.3 论文创新点
2 文献综述
2.1 关于股票相关性和波动的研究
2.2 张量以及关系数据的研究
3 张量基础
3.1 概念
3.2 张量的基本运算
3.3 CP分解和Tucker分解
3.4 本章小结
4 广义Rescal分解
4.1 Rescal分解和广义张量分解
4.1.1 Rescal分解
4.1.2 广义张量分解
4.2 广义Rescal分解
4.2.1 引言
4.2.2 算法的设计
4.3 仿真实验
4.3.1 数据生成
4.3.2 实验结果
4.4 本章小结
5 实证分析
5.1 数据的选择
5.2 关系指标的选择
5.3 构建张量
5.4 实验结果
5.4.1 随机缺失填充
5.4.2 停牌股票缺失值的填充
5.5 本章小结
6 总结与展望
6.1 本文工作总结
6.2 今后工作展望
致谢
参考文献
附录
本文编号:3746340
【文章页数】:64 页
【文章目录】:
摘要
Abstract
1 绪论
1.1 研究背景及意义
1.1.1 研究背景
1.1.2 研究意义
1.2 研究内容与方法
1.2.1 研究内容
1.2.2 研究方法
1.3 论文创新点
2 文献综述
2.1 关于股票相关性和波动的研究
2.2 张量以及关系数据的研究
3 张量基础
3.1 概念
3.2 张量的基本运算
3.3 CP分解和Tucker分解
3.4 本章小结
4 广义Rescal分解
4.1 Rescal分解和广义张量分解
4.1.1 Rescal分解
4.1.2 广义张量分解
4.2 广义Rescal分解
4.2.1 引言
4.2.2 算法的设计
4.3 仿真实验
4.3.1 数据生成
4.3.2 实验结果
4.4 本章小结
5 实证分析
5.1 数据的选择
5.2 关系指标的选择
5.3 构建张量
5.4 实验结果
5.4.1 随机缺失填充
5.4.2 停牌股票缺失值的填充
5.5 本章小结
6 总结与展望
6.1 本文工作总结
6.2 今后工作展望
致谢
参考文献
附录
本文编号:3746340
本文链接:https://www.wllwen.com/jingjifazhanlunwen/3746340.html