面向Mashup服务的半监督服务聚类与服务标签推荐方法研究
发布时间:2021-01-03 02:25
Web 2.0时代,Web服务数量飞速增长,基于Web集成的Mashup在兴起之后,也随之急剧增加。Mashup技术为更快速、更方便地开发新的Web服务提供了可能,但服务数量的快速增长使Mashup服务的开发人员需要耗费大量时间精力来对已有的服务进行管理。面对大量的服务数据,如何通过机器学习的技术对其进行适当的分析和处理,完善对大量Mashup服务的管理效率,是当下服务计算领域的研究热门。本文基于对服务标签推荐方法的调研之上,在2016和2018年公开的两个数据集上,对比了基于监督学习的Mashup服务标签推荐方法(SL-MSTR)和基于无监督学习(服务聚类)的Mashup服务标签推荐方法(SC-MSTR)。两组数据的实验结果都表明无监督的SC-MSTR方法比有监督的SL-MSTR方法的标签推荐质量高,同时当候选标签数目变化时无监督SC-MSTR方法也始终优于有监督的SL-MSTR方法。通过对实验结果的进一步分析,发现在进行服务标签推荐时,SL-MSTR方法依赖当前Mashup服务与候选标签之间的相似度,SC-MSTR方法依赖当前Mashup服务与已有真实标签集的Mashup服务的相似...
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
论文结构图
9第2章Mashup服务聚类方法研究随着Mashup服务资源的急剧增多,根据Mashup服务的功能对其进行聚类已经成为一种改善Mashup服务管理的有效方法。绪论中已经对Mashup服务聚类进行了相关的技术调研。本章中将研究常见的Mashup服务聚类方法,并借鉴技术调研中基于先验知识的聚类方法,提出了基于伪标记的半监督服务聚类方法。在传统服务聚类方法的基础上,引入监督学习方法,辅助改善聚类效果。并通过多组对比实验的结果,分析基于伪标记的Mashup服务半监督聚类方法的聚类效果,为改善Mashup服务聚类性能提供一种新思路。2.1传统Mashup服务聚类方法聚类是一种依据元素间相似性将其聚集成不同类簇的学习任务。聚类的目的是使在同一类簇中的元素的相同特质最大化,而使在不同类簇中的元素的不同特质最大化[31]。对Mashup服务进行聚类,将具有相似功能的服务聚集在一起,可以改善对Mashup服务管理的效率。WSDL文档作为Mashup服务的描述文档,相较于Mashup服务的其它信息来说,能更好地刻画Mashup服务。现有的Mashup服务聚类大多是直接从Mashup服务的WSDL文档中直接提取特征,再选取聚类方法进行聚类,这种方法利用了WSDL文档对Mashup服务性能较为全面的描述,再结合自然语言处理的方法,对文本特征进行提取,最后聚类,达到对已有的Mashup服务进行大致分类的效果,改善Mashup服务管理效率。传统Mashup聚类方法原理图如图2-1所示。图2-1传统Mashup服务聚类方法原理
13果,依赖于上一步文本向量化的效果,这也是本问选择两种完全不同的文本向量化方法进行对比的原因。本文引入监督学习的思想来辅助聚类,是在传统服务聚类方法的基础上进行的,因此选用较为经典的传统聚类方法,可以获得更客观的对比效果。2.2基于监督学习的Mashup服务聚类方法聚类是一种多变量的分类统计方法。然而,与有监督的学习方法相比,聚类对数据的分类能力就弱得多。因此,本章的Mashup服务聚类优化方法研究中,引入了监督学习的思想来对服务聚类方法进行优化。2.2.1优化策略传统的服务聚类方法优化策略通常是在图2-1的传统服务聚类方法的过程中,对某些步骤进行优化,如图2-5所示。传统的服务聚类优化方法有优化特征选取过程以及对服务聚类部分的聚类算法进行优化的内部优化方法。前者通常为采用不同的服务特征提取方式[4,16,22]或通过辅助信息添加某些有效特征[8-9],后者针对不同的数据特征选取更优的聚类算法[1]或将已有的聚类算法改进成性能更优的聚类算法[11,19,39]。传统的这些优化方法即在聚类过程的某些步骤上进行优化,提升聚类过程中某个步骤的性能,达到优化整个聚类方法的目的。图2-5传统服务聚类优化策略
【参考文献】:
期刊论文
[1]基于主题模型的Mashup标签推荐方法[J]. 刘建勋,石敏,周栋,唐明董,张婷婷. 计算机学报. 2017(02)
本文编号:2954128
【文章来源】:武汉理工大学湖北省 211工程院校 教育部直属院校
【文章页数】:77 页
【学位级别】:硕士
【部分图文】:
论文结构图
9第2章Mashup服务聚类方法研究随着Mashup服务资源的急剧增多,根据Mashup服务的功能对其进行聚类已经成为一种改善Mashup服务管理的有效方法。绪论中已经对Mashup服务聚类进行了相关的技术调研。本章中将研究常见的Mashup服务聚类方法,并借鉴技术调研中基于先验知识的聚类方法,提出了基于伪标记的半监督服务聚类方法。在传统服务聚类方法的基础上,引入监督学习方法,辅助改善聚类效果。并通过多组对比实验的结果,分析基于伪标记的Mashup服务半监督聚类方法的聚类效果,为改善Mashup服务聚类性能提供一种新思路。2.1传统Mashup服务聚类方法聚类是一种依据元素间相似性将其聚集成不同类簇的学习任务。聚类的目的是使在同一类簇中的元素的相同特质最大化,而使在不同类簇中的元素的不同特质最大化[31]。对Mashup服务进行聚类,将具有相似功能的服务聚集在一起,可以改善对Mashup服务管理的效率。WSDL文档作为Mashup服务的描述文档,相较于Mashup服务的其它信息来说,能更好地刻画Mashup服务。现有的Mashup服务聚类大多是直接从Mashup服务的WSDL文档中直接提取特征,再选取聚类方法进行聚类,这种方法利用了WSDL文档对Mashup服务性能较为全面的描述,再结合自然语言处理的方法,对文本特征进行提取,最后聚类,达到对已有的Mashup服务进行大致分类的效果,改善Mashup服务管理效率。传统Mashup聚类方法原理图如图2-1所示。图2-1传统Mashup服务聚类方法原理
13果,依赖于上一步文本向量化的效果,这也是本问选择两种完全不同的文本向量化方法进行对比的原因。本文引入监督学习的思想来辅助聚类,是在传统服务聚类方法的基础上进行的,因此选用较为经典的传统聚类方法,可以获得更客观的对比效果。2.2基于监督学习的Mashup服务聚类方法聚类是一种多变量的分类统计方法。然而,与有监督的学习方法相比,聚类对数据的分类能力就弱得多。因此,本章的Mashup服务聚类优化方法研究中,引入了监督学习的思想来对服务聚类方法进行优化。2.2.1优化策略传统的服务聚类方法优化策略通常是在图2-1的传统服务聚类方法的过程中,对某些步骤进行优化,如图2-5所示。传统的服务聚类优化方法有优化特征选取过程以及对服务聚类部分的聚类算法进行优化的内部优化方法。前者通常为采用不同的服务特征提取方式[4,16,22]或通过辅助信息添加某些有效特征[8-9],后者针对不同的数据特征选取更优的聚类算法[1]或将已有的聚类算法改进成性能更优的聚类算法[11,19,39]。传统的这些优化方法即在聚类过程的某些步骤上进行优化,提升聚类过程中某个步骤的性能,达到优化整个聚类方法的目的。图2-5传统服务聚类优化策略
【参考文献】:
期刊论文
[1]基于主题模型的Mashup标签推荐方法[J]. 刘建勋,石敏,周栋,唐明董,张婷婷. 计算机学报. 2017(02)
本文编号:2954128
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/2954128.html
最近更新
教材专著