当前位置:主页 > 科技论文 > 数学论文 >

面向缺失数据的时间序列分类方法研究

发布时间:2024-01-30 22:58
  为了了解病人的身体状况,医生会对病人的各项生理指标进行监测,这些监测记录形成了医疗时间序列。我们可以根据这些记录对病人的住院死亡与否、所患疾病以及住院时间长短等进行预测任务。医疗时间序列的缺失率比一般时间序列高很多,原因是医生只会选择与病人身体状况相关的变量进行监测,而且不同的变量有不同的监测频率。在医疗时间序列分类问题的研究方面,相关学术论文总量不多,但近年来依然有两个出色且具有影响力的模型。它们分别是GRU-D和channel-wise LSTM。因为它们优越的性能和简洁的设计原理所以它们已经在很多问题上得到应用。但是他们的缺点也不可忽视。GRU-D没有考虑变量的缺失率,而且它在训练过程中把真实值和填充值混合相加,让模型不能直接感应真实值的变化以及不能同时接收每个变量和它的缺失标记。channel-wise LSTM针对每个变量都采用了一个独立的LSTM模型进行处理,模型的计算量巨大。在GRU-D和channel-wise LSTM的启发下,本文提出了一个能独立感受变量的GRU(variable sensitive GRU,VS-GRU)。它有三个创新点:第一,因为变量的缺失率与它...

【文章页数】:65 页

【学位级别】:硕士

【部分图文】:

图1-1一个医疗时间序列的例子,它代表6个变量在12个时间步之内的观测标

图1-1一个医疗时间序列的例子,它代表6个变量在12个时间步之内的观测标

间序列中的数据缺失问题有可能是因为记录的仪器失效,记录丢失等等一系列客观因素[15]造成的,然而这种原因在医疗时间序列的缺失问题上并不多见。在现实生活中,导致医疗时间序列的数据缺失问题往往是主观因素造成的缺失。考虑到监测成本,病人的实际情况以及不同生理特征基于时间的变化等因素,我....


图2-1LSTM的基本架构[57]

图2-1LSTM的基本架构[57]

第二章相关理论及技术11列之间的距离也有多种计算方法,如夹角余弦、皮尔森相关系数、杰卡德相似系数等,根据实际情况的不同选择最适合的距离定义方式。最后基于模型的方法有自回归滑动平均模型(auto-regressiveintegratedmovingaverage,ARIMA)[52....


图2-2GRU的基本架构[58]

图2-2GRU的基本架构[58]

华南理工大学硕士学位论文12型的变型,LSTM和GRU来处理时间序列问题。为了解决RNN中的梯度爆炸和梯度消失的问题,LSTM采用了三个门控机制,遗忘门,输入门,输出门,以及细胞状态。LSTM思想的关键之处在于细胞状态的变化,遗忘门决定要从细胞状态中丢弃什么信息,输入门决定根据此....


图2-3RNN实现时间序列分类

图2-3RNN实现时间序列分类

第二章相关理论及技术13=σ(+1+)(2-8)=tanh(+(1)+)(2-9)=(1)1+(2-10)上面公式中,表示矩阵对应元素相乘。无论是LSTM还是GRU都是一个针对时间序列的每个节点提取信息的结构,我们认为时间序列具有内在的规律性,因此我们只需要把用一个类似图2-1和....



本文编号:3890512

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/yysx/3890512.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2dbe1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com