当前位置:主页 > 科技论文 > 软件论文 >

基于LDA聚类的语义Web服务发现

发布时间:2017-09-24 00:33

  本文关键词:基于LDA聚类的语义Web服务发现


  更多相关文章: Web服务发现 狄利克雷分布 聚类 语义Web服务


【摘要】:随着互联网与分布式技术的快速发展,面向服务的体系结构(SOA)得到了学术界和工业界的青睐和广泛应用。作为一种基于互联网标准和XML规范的新型分布式计算模型和实现SOA的主要技术,Web服务已成为当前研究的热点。随着互联网上Web服务数量的指数型增长,如何从庞大的Web服务中有效地获得满足需求功能的Web服务?如何在功能相似的Web服务中找到用户最满意的服务?这些难以解决的问题,正是Web服务发现的研究内容。目前常见的Web服务发现方法主要有基于逻辑的方法、基于非逻辑的方法和基于混合的方法。其中基于逻辑的方法依赖于推理机和推理规则的完整性,虽然准确性较高,但是灵活性和可行性较差;而基于非逻辑的方法很难确定一个合适的相似度计算函数,并且相似度计算函数的优劣也很难保证;基于混合的方法能够充分取长补短,且有很多实验证明混合方法具有明显的效果。本文在已有工作的基础上,提出了一种基于LDA聚类的语义Web服务发现方法,也是一种混合的Web服务发现方法。即首先对OWL-S Web服务文档解析,得到文档词汇向量;然后对文档词汇向量进行扩充,使文档语义信息更加丰富;再对文档扩充词汇向量集合建模,并进行训练和推断,得到文档-主题分布,并对Web服务文档聚类;最后通过查找Web服务请求记录或者直接在簇中查找满足需求的Web服务。论文的主要工作包括:(1)文档解析。提出了一种新颖的文档解析方法,即首先对OWL-S文档进行解析得到服务名称、服务描述、输入和输出四个关键信息,然后对服务名称和服务描述进行去停用词、词性还原等处理得到文档词汇向量。为了丰富文档语义信息,解析OWL-S文档对应的本体OWL文件,得到输入输出概念的等价类、父类、祖先类、子类、后代类等相关本体类概念,加入文档词汇向量,并且利用WordNet和Word2Vec对处理后的文档词汇向量查找相似度较高的词汇,再加入其中,最后合并所有词汇向量,得到扩充文档词汇向量。扩充后的文档词汇向量具有丰富的语义信息。(2)文档聚类。实现一种基于概率主题模型的文档聚类方法,即首先对扩充后的文档词汇向量集合建立LDA主题模型,并使用Gibbs采样算法进行训练和推断得到文档-主题分布,基于此,对文档使用本文提出的LKMSIMPClustering聚类算法,对所有文档进行聚类,得到Web服务簇集合。(3)请求查询。实现了一种轻量级的Web服务请求查询,即首先查找备忘录DB模块中是否存在对应的Web服务请求记录,若存在,直接返回查询结果,若不存在,则需要查找Web服务簇中最相关的簇,并在这个簇中匹配满足相似度阈值的Web服务集,作为Web服务发现的结果。(4)系统开发和实验评估。完成了基于LDA聚类的语义Web发现系统的开发,针对OWLS-TC4和hRESTS-TC3_release2这两个服务数据集(有1083个服务和42个查询请求)进行了充分的实验,并与现有工作在准确率、召回率、F值以及效率等方面进行了对比。实验结果表明:本系统比传统的基于TFIDF的VSM方法在准确率、召回率和F值方面分别高出13.52%、37.37%和30.47%,并且系统的性能也更加好。我们对准确率、召回率和F值进行了显著性验证,并通过一个实例完整演示了Web服务的发现过程。
【关键词】:Web服务发现 狄利克雷分布 聚类 语义Web服务
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.1;TP393.09
【目录】:
  • 摘要5-7
  • ABSTRACT7-11
  • 第一章 引言11-17
  • 1.1 研究背景11-12
  • 1.2 研究现状12-14
  • 1.3 研究内容14-16
  • 1.4 论文结构16-17
  • 第二章 相关技术概述17-23
  • 2.1 Web服务概述17-18
  • 2.1.1 Web服务与SOA17
  • 2.1.2 Web服务体系结构17-18
  • 2.1.3 Web服务核心技术18
  • 2.2 语义Web相关技术概述18-20
  • 2.2.1 语义Web体系结构18-19
  • 2.2.2 本体19-20
  • 2.2.3 本体描述语言和OWL20
  • 2.3 语义Web服务20-22
  • 2.3.1 语义Web服务描述20-21
  • 2.3.2 语义Web服务发现21-22
  • 2.4 Web服务聚类22
  • 2.5 本章小结22-23
  • 第三章 Web服务解析和语义扩充23-34
  • 3.1 OWL-S文档的解析和处理24-25
  • 3.2 Web服务描述语义扩充25-29
  • 3.2.1 解析OWL本体文档25-26
  • 3.2.2 使用WordNet扩充服务描述语义26-28
  • 3.2.3 使用Word2Vec扩充服务描述语义28-29
  • 3.3 LDA主题模型和Gibbs采样29-33
  • 3.3.1 LDA主题模型29-31
  • 3.3.2 Gibbs采样31-33
  • 3.4 本章小结33-34
  • 第四章 语义Web服务的聚类和发现34-41
  • 4.1 文档相似度度量方法35-36
  • 4.2 语义Web服务聚类36-37
  • 4.3 语义Web服务发现37-40
  • 4.3.1 备忘录DB模块37-39
  • 4.3.2 Web服务匹配模块39-40
  • 4.4 本章小结40-41
  • 第五章 实验分析41-57
  • 5.1 研究问题和实验目的41
  • 5.2 评价指标41-43
  • 5.2.1 Web服务聚类评价指标42
  • 5.2.2 Web服务发现评价指标42-43
  • 5.3 实验数据和环境43-45
  • 5.3.1 实验数据43-44
  • 5.3.2 实验环境44-45
  • 5.4 实验结果及分析45-53
  • 5.4.1 语义Web服务聚类实验分析45-46
  • 5.4.2 语义Web服务发现实验分析46-53
  • 5.5 案例分析53-55
  • 5.6 本章小结55-57
  • 第六章 总结与展望57-60
  • 6.1 本文总结57-58
  • 6.2 未来展望58-60
  • 参考文献60-65
  • 致谢65-66
  • 攻读硕士学位期间主要的研究成果66-67

【相似文献】

中国期刊全文数据库 前7条

1 赖裕平;周亚建;丁洪伟;郭玉翠;郭春;杨义先;;混合逆狄利克雷分布的变分学习及应用[J];电子学报;2014年07期

2 温腊;芮建武;何婷婷;郭亮;;利用并行GPU对分层分布式狄利克雷分布算法加速[J];计算机应用;2013年12期

3 余传明;张小青;陈雷;;基于LDA模型的评论热点挖掘:原理与实现[J];情报理论与实践;2010年05期

4 陈广福;蔡国永;林航;王瑞丽;刘国宾;;多Agent系统中基于狄利克雷分布的信任模型[J];计算机工程;2011年14期

5 王旭仁;姚叶鹏;冉春风;何发镁;;一种并行LDA主题模型建立方法研究[J];北京理工大学学报;2013年06期

6 张彭成;翟玉庆;;基于可信机制的云服务提供商选择模型[J];南京师范大学学报(工程技术版);2013年02期

7 ;[J];;年期

中国重要会议论文全文数据库 前1条

1 林琛;汪卫;;Web论坛上的垃圾贴过滤[A];第26届中国数据库学术会议论文集(B辑)[C];2009年

中国硕士学位论文全文数据库 前4条

1 曹赖平;基于LDA聚类的语义Web服务发现[D];南京大学;2016年

2 李云之;基于文本分析的标签推荐研究及实现[D];北京邮电大学;2012年

3 黄海魂;基于用户概貌和评分序列的混合托攻击检测[D];重庆大学;2014年

4 陈阳平;基于概率生成主题模型的图像场景分类方法研究[D];西安电子科技大学;2014年



本文编号:908364

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/908364.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ac060***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com