基于时间序列聚类的文献主题分析研究
发布时间:2024-03-01 05:35
主题分析能够从文献中选择所有特征以及对重点主题内容进行分析,进而实现对文献的检索。也就是说,分析和把握文献内容是主题分析的核心问题。为了提取主题概念,应选取与语义相对应的中心词当作文献的检索标引。实际上,主题索引的质量受到主题分析质量的直接影响,情报检索的有效性取决于主题分析的好坏。因此,为更好地进行主题分析,主要研究内容如下:(1)针对现有时间序列聚类方法效率低、时间复杂度高等问题,提出了一种基于矩阵轮廓和社会网络技术的时间序列聚类方法。首先,利用矩阵概要文件(Matrix Profile)方法,从两条时间序列中快速找到一对最相似的子序列,测量时间序列之间的相关性,降低时间复杂度。两条时间序列之间的相关性是用最相似子序列对的数量来衡量的。其次,该方法构造了一个网络来表示时间序列之间的相关性。该网络将每条时间序列视为一个顶点,将时间序列之间的关系视为边:对于相关性更强的两条时间序列,它们之间边的权值更大;最后,用社区检测方法对网络进行划分。实验采用经典的时间序列聚类方法作对比:Louvain-εNN,k-medoids,k-shape。实验结果表明,该方法是一种较好的时间序列聚类方法,...
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
本文编号:3915497
【文章页数】:80 页
【学位级别】:硕士
【部分图文】:
图2.1时间序列和所有子序列都是
第2章理论基础15图2.1时间序列和所有子序列都是图2.2和的距离矩阵定义4:距离剖面D是一个向量,是给定查询序列与子序列集中每条子序列的欧式距离。给定两条时间序列A和B,根据定义3,我们可以得到两个相应的子序列集A和B,对于A中每条子序列A,计算其与B中每条子序列的距离,并且记....
图2.2和的距离矩阵
第2章理论基础15图2.1时间序列和所有子序列都是图2.2和的距离矩阵定义4:距离剖面D是一个向量,是给定查询序列与子序列集中每条子序列的欧式距离。给定两条时间序列A和B,根据定义3,我们可以得到两个相应的子序列集A和B,对于A中每条子序列A,计算其与B中每条子序列的距离,并且记....
图3.3A接A,B,C和D之接图以及聚类之间的网络连类结果
数据,和图3个节每条列的有向据式对用第为了说明其中V据集的大小,。分别为由图3.2A,为了帮助3.2所示。节点表示,条边进行定的距离最小向边表示从式(3.3),得用更高的边恋??怐惪耑怓?聮v耭聃怅?胴胫惕惐胊胁育??3章基于明序列之间的,,,校EW,和表示B,C和D之助理解构建....
图3.4T1的所所有子序列和和相应的最小子序列所所在时间序列列
相似3.1簇。得到性。的序获得的最第似性较大,.4实例与过我们将包将所有的到与每个子图图3.4左序列;我们得的。利用最相似的子3章基于而不同簇内过程包含23条长的时间序列转子序列最相似3.4T1的所上角的蓝们称它为T1。用MASS算法子序列,以及matrixprof内序列间的长度....
本文编号:3915497
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3915497.html