跨域多模态数据分析关键技术研究
发布时间:2024-06-29 03:23
跨域多模态数据集在许多领域发挥重要作用,本文主要研究征信背景下的多字段分类数据和多元时间序列数据之间的数据融合问题。现有跨域多模态数据融合的研究主要集中在文本与图像间融合以及视频与音频间的融合,鲜有人研究多字段分类数据与多元时间序列数据之间的融合,且这两种数据间存在较大的结构和语义上的差异,如何设计模型使其既能够最大可能地挖掘每种模态数据所蕴含的信息,又能弥补两种数据结构和语义上的差异使其很好地融合,成为本文的一大难点。本文主要包括如下三部分研究内容。首先,本文提出分类多字段数据的特征表示模型CFM模型。该模型通过在FM模型的基础上引入Cat2vec模型的交叉层+K-Max池化层(Interaction Layer+K-Max Pooling Layer)结构,解决了传统模型无法挖掘特征间存在的高阶潜在模式且精度不足等问题。其次,本文提出了多元时间序列数据特征表示模型IA-RNN模型。该模型通过在基于基本LSTM单元的模型上引入Input-Attention,使得模型可以捕捉不同维度的输入数据在每个时间点拥有的不同程度的作用,从而可以更好地挖掘多元时间序列数据中蕴含的潜在信息。最后,本...
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
本文编号:3997092
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图2-3新模型准确率及损失曲线
图2-3新模型准确率及损失曲线模型在测试集的ROC曲线结果如下图2-4所示,通过计算可知模型的AUC值达到0.8729。CFM模型与FM模型和Cat2vec模型的对比实验结果如下图2-5所示,可知在AUC评价指标下,FM模型AUC值为0.....
图2-4新模型ROC曲线
图2-3新模型准确率及损失曲线模型在测试集的ROC曲线结果如下图2-4所示,通过计算可知模型的AUC值达到0.8729。CFM模型与FM模型和Cat2vec模型的对比实验结果如下图2-5所示,可知在AUC评价指标下,FM模型AUC值为0.....
图2-5实验效果对比图
图2-3新模型准确率及损失曲线模型在测试集的ROC曲线结果如下图2-4所示,通过计算可知模型的AUC值达到0.8729。CFM模型与FM模型和Cat2vec模型的对比实验结果如下图2-5所示,可知在AUC评价指标下,FM模型AUC值为0.....
图2-6Dropout对比实验
提升了2个百分点,可见新模型提升效果显著。我们还测试了不同超参数设置对模型效果的影响。首先,我们测试了不同dropout值对模型效果的影响,由图2-6可知,模型效果随dropout值先提升后降低,当dropout值小于0.3时模型过于复杂,存在过拟合现象,....
本文编号:3997092
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3997092.html