面向服务的社会化标注方法研究
发布时间:2023-01-29 20:20
在过去一些年中,由于资源易于分类以及可以使用标签来检索内容,社会标签系统越来越受欢迎。社会标注是Web2.0引入的一种新颖和有用的机制。日益增多的用户通过社会标注行为提供资源的信息,于是就出现基于标签的搜索方法,通过用户所标注的标签就揭示了用户对于内容的偏好。因此,标注信息可用于做推荐。社会标注系统的用户可以定义个人分类,其他用户也可以浏览相关资源,尽管如此,由于缺乏对标注过程的有效管理,以及缺乏标签之间的关系的定义,用户所做的资源分类不见得是很合理的,这就产生了资源共享的局限性。 目前利用标签进行推荐的方法主要有三种:基于三部图的推荐方法,基于概率模型的推荐方法,基于协同过滤的推荐方法。基于三部图存在的不足是将用户、对象、标签看成三类不同的节点,连边只在不同类节点之间,同类节点之间不存在连边,这种人为的划分方式割裂了三类节点相互之间的“共现”关系,从而不可避免地会造成信息丢失。基于概率模型算法存在的不足是以机器学习为基础,这种方法一般采用Gibbs抽样,或者期望最大化方法来迭代获得最优的推荐结果,因此对计算机的计算能力要求较高。特别是当数据量规模非常大的时候,使用基于概率模型的...
【文章页数】:109 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 Web服务
1.1.2 Web服务索引
1.1.3 社会化标签的起源
1.1.4 社会化标签系统模型
1.1.5 社会化标签系统的特点与不足
1.1.6 个性化信息推荐
1.2 问题的提出及意义
1.3 本文研究的主要内容及研究体系
1.4 论文的组织结构
第二章 相关研究
2.1 引言
2.2 信息检索(IR)
2.2.1 信息检索简介
2.2.2 信息检索的目标
2.2.3 信息检索的基本方法
2.3 Web服务发现
2.3.1 扩充服务请求
2.3.2 使用图匹配的BPEL过程排序
2.3.3 基于层次的Web服务发现
2.3.4 在异构网络中的服务发现
2.4 个性化信息推荐研究现状
2.5 标注分布
2.5.1 标注系统词汇
2.5.2 资源的标签增长
2.5.3 用户标签词汇的增长
2.6 推荐标签
第三章 基于随机游走的标签推荐和服务发现方法
3.1 引言
3.2 相关研究工作
3.3 基于随机游走的标签推荐方法
3.3.1 网络模型
3.3.2 随机游走模型
3.3.3 在TTN上的随机游走
3.4 API服务的相似性
3.4.1 文本文档的向量空间模型
3.4.2 余弦相似度
3.5 基于随机游走的服务查询和标签推荐方法
3.5.1 标签推荐
3.5.2 基于标签的服务查询
3.5.3 算法复杂性分析
3.6 实验及分析
3.6.1 数据收集
3.6.2 标签过滤
3.6.3 度量指标
3.6.4 标签推荐
3.6.5 对比试验
3.6.6 系统验证
3.7 本章小结
第四章 基于标签推荐的服务聚类方法
4.1 引言
4.2 相关研究工作
4.3 基于扩充和精化的标签推荐
4.4 Web服务聚类
4.4.1 预处理文档
4.4.2 皮尔逊相关系数
4.4.3 API、Tag相似性
4.4.4 相似性集成
4.4.5 常用的聚类方法
4.4.6 基于Mashup服务相似性的K-Means算法
4.5 实验
4.5.1 数据集和评价指标
4.5.2 实验方法
4.5.3 实验结果分析
4.6 本章小结
第五章 基于主题的标签排序
5.1 引言
5.2 相关研究工作
5.3 标签推荐
5.3.1 问题定义
5.3.2 Latent Dirichlet Allocation(LDA)
5.3.3 基于话题的标签推荐
5.4 标签话题提取
5.5 实验
5.5.1 文本和网页的预处理
5.5.2 数据收集和分析
5.5.3 实验设置及评价方法
5.5.4 delicious数据集的结果
5.5.5 ProgrammableWeb数据集的结果
5.6 本章小结
第六章 基于主动标注的标签预测
6.1 引言
6.2 相关研究工作
6.3 主动学习理论
6.3.1 主动学习的简单介绍
6.3.2 主动学习样本选择策略
6.4 主动标注
6.4.1 样本选择
6.4.2 标签预测
6.5 实验
6.5.1 数据集和参数设置
6.5.2 实验步骤
6.5.3 实验结果
6.6 本章小结
第七章 总结与展望
7.1 论文总结
7.2 下一步工作展望
参考文献
攻读博士学位期间的研究成果
致谢
【参考文献】:
期刊论文
[1]基于软件网络的服务自动分类和推荐方法研究[J]. 潘伟丰,李兵,邵波,何鹏. 计算机学报. 2011(12)
[2]高校图书馆用户信息行为研究述略[J]. 熊菊敏,喻华林. 科技管理研究. 2007(12)
本文编号:3732843
【文章页数】:109 页
【学位级别】:博士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景
1.1.1 Web服务
1.1.2 Web服务索引
1.1.3 社会化标签的起源
1.1.4 社会化标签系统模型
1.1.5 社会化标签系统的特点与不足
1.1.6 个性化信息推荐
1.2 问题的提出及意义
1.3 本文研究的主要内容及研究体系
1.4 论文的组织结构
第二章 相关研究
2.1 引言
2.2 信息检索(IR)
2.2.1 信息检索简介
2.2.2 信息检索的目标
2.2.3 信息检索的基本方法
2.3 Web服务发现
2.3.1 扩充服务请求
2.3.2 使用图匹配的BPEL过程排序
2.3.3 基于层次的Web服务发现
2.3.4 在异构网络中的服务发现
2.4 个性化信息推荐研究现状
2.5 标注分布
2.5.1 标注系统词汇
2.5.2 资源的标签增长
2.5.3 用户标签词汇的增长
2.6 推荐标签
第三章 基于随机游走的标签推荐和服务发现方法
3.1 引言
3.2 相关研究工作
3.3 基于随机游走的标签推荐方法
3.3.1 网络模型
3.3.2 随机游走模型
3.3.3 在TTN上的随机游走
3.4 API服务的相似性
3.4.1 文本文档的向量空间模型
3.4.2 余弦相似度
3.5 基于随机游走的服务查询和标签推荐方法
3.5.1 标签推荐
3.5.2 基于标签的服务查询
3.5.3 算法复杂性分析
3.6 实验及分析
3.6.1 数据收集
3.6.2 标签过滤
3.6.3 度量指标
3.6.4 标签推荐
3.6.5 对比试验
3.6.6 系统验证
3.7 本章小结
第四章 基于标签推荐的服务聚类方法
4.1 引言
4.2 相关研究工作
4.3 基于扩充和精化的标签推荐
4.4 Web服务聚类
4.4.1 预处理文档
4.4.2 皮尔逊相关系数
4.4.3 API、Tag相似性
4.4.4 相似性集成
4.4.5 常用的聚类方法
4.4.6 基于Mashup服务相似性的K-Means算法
4.5 实验
4.5.1 数据集和评价指标
4.5.2 实验方法
4.5.3 实验结果分析
4.6 本章小结
第五章 基于主题的标签排序
5.1 引言
5.2 相关研究工作
5.3 标签推荐
5.3.1 问题定义
5.3.2 Latent Dirichlet Allocation(LDA)
5.3.3 基于话题的标签推荐
5.4 标签话题提取
5.5 实验
5.5.1 文本和网页的预处理
5.5.2 数据收集和分析
5.5.3 实验设置及评价方法
5.5.4 delicious数据集的结果
5.5.5 ProgrammableWeb数据集的结果
5.6 本章小结
第六章 基于主动标注的标签预测
6.1 引言
6.2 相关研究工作
6.3 主动学习理论
6.3.1 主动学习的简单介绍
6.3.2 主动学习样本选择策略
6.4 主动标注
6.4.1 样本选择
6.4.2 标签预测
6.5 实验
6.5.1 数据集和参数设置
6.5.2 实验步骤
6.5.3 实验结果
6.6 本章小结
第七章 总结与展望
7.1 论文总结
7.2 下一步工作展望
参考文献
攻读博士学位期间的研究成果
致谢
【参考文献】:
期刊论文
[1]基于软件网络的服务自动分类和推荐方法研究[J]. 潘伟丰,李兵,邵波,何鹏. 计算机学报. 2011(12)
[2]高校图书馆用户信息行为研究述略[J]. 熊菊敏,喻华林. 科技管理研究. 2007(12)
本文编号:3732843
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3732843.html