关系网络数据的半监督分类方法研究
发布时间:2022-01-20 22:36
随着互联网的发展,特别是移动互联网和社会化媒体的普及,实际应用中需要处理的数据样本,不再是单独存在的个体,而是与其它数据样本相互依赖。这种存在相互依赖关系的数据样本集合,被称为关系网络数据。如在微博应用中,用户与用户相互关注,构成了一个以微博用户为节点,关注关系为边的关系网络数据。对关系网络数据中的样本进行分类时,有效利用样本间的依赖关系能提高分类精度。如相互关注的微博用户倾向于有相似的兴趣爱好,存在超链接关系的网页倾向于有相似的主题。关系网络数据的分类问题也被称为协同分类问题。近十年来,国内外研究人员对协同分类问题进行大量的研究并提出很多能利用关系提高分类精度的算法。然而在实际应用中,要构建大量的训练样本,成本非常高,会耗费大量的人力和物力。于是在训练样本稀少的情况下,如何利用大量测试样本进行半监督协同分类成为近几年的研究热点。本文研究了关系网络数据的半监督分类问题并提出一些解决方法。主要工作包括:(1)将关系网络数据的半监督分类问题分解成三个核心子问题:基于内容属性的半监督分类问题、关系的类标传递能力的学习问题和内容属性与关系信息的结合问题。(2)提出一个强同质关系网络生成方法,在...
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景和意义
1.2 国内外相关研究工作综述
1.2.1 关系网络数据的分类方法研究现状
1.2.2 关系网络数据的半监督分类方法研究现状
1.2.3 关系网络数据中半监督分类的挑战
1.3 本文的主要工作
1.4 本文的组织结构
第2章 相关基础知识
2.1 问题的定义
2.2 协同分类算法
2.2.1 迭代协同分类算法
2.2.2 使用松弛标注的邻居加权投票法
2.3 半监督协同分类算法
2.3.1 隐含网络传递算法
2.3.2 半监督迭代协同分类算法
2.4 半监督协同分类核心问题剖析
2.4.1 基于内容属性的半监督分类问题
2.4.2 关系的类标传递能力学习问题
2.4.3 内容属性与关系信息的结合问题
2.5 本章小结
第3章 面向类标传递能力学习的强同质网络生成方法
3.1 问题的定义
3.2 强同质关系网络的生成算法
3.2.1 两步可达路径
3.2.2 算法描述
3.3 实验结果与分析
3.4 本章小结
第4章 基于网络正则化生成模型的半监督分类方法
4.1 基本思想
4.2 网络正则化生成模型(GMNR)
4.2.1 基于 PLSA 的生成模型
4.2.2 网络正则化因子
4.2.3 全局最优化问题
4.3 GMNR 的参数学习及类标预测
4.3.1 期望最大化
4.3.2 参数初始值
4.3.3 算法描述及分析
4.4 实验结果与分析
4.4.1 数据集
4.4.2 对比算法
4.4.3 评估方法
4.4.4 结果与分析
4.4.5 收敛性和正则化参数λ
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3599648
【文章来源】:哈尔滨工业大学黑龙江省 211工程院校 985工程院校
【文章页数】:61 页
【学位级别】:硕士
【文章目录】:
摘要
Abstract
第1章 绪论
1.1 研究背景和意义
1.2 国内外相关研究工作综述
1.2.1 关系网络数据的分类方法研究现状
1.2.2 关系网络数据的半监督分类方法研究现状
1.2.3 关系网络数据中半监督分类的挑战
1.3 本文的主要工作
1.4 本文的组织结构
第2章 相关基础知识
2.1 问题的定义
2.2 协同分类算法
2.2.1 迭代协同分类算法
2.2.2 使用松弛标注的邻居加权投票法
2.3 半监督协同分类算法
2.3.1 隐含网络传递算法
2.3.2 半监督迭代协同分类算法
2.4 半监督协同分类核心问题剖析
2.4.1 基于内容属性的半监督分类问题
2.4.2 关系的类标传递能力学习问题
2.4.3 内容属性与关系信息的结合问题
2.5 本章小结
第3章 面向类标传递能力学习的强同质网络生成方法
3.1 问题的定义
3.2 强同质关系网络的生成算法
3.2.1 两步可达路径
3.2.2 算法描述
3.3 实验结果与分析
3.4 本章小结
第4章 基于网络正则化生成模型的半监督分类方法
4.1 基本思想
4.2 网络正则化生成模型(GMNR)
4.2.1 基于 PLSA 的生成模型
4.2.2 网络正则化因子
4.2.3 全局最优化问题
4.3 GMNR 的参数学习及类标预测
4.3.1 期望最大化
4.3.2 参数初始值
4.3.3 算法描述及分析
4.4 实验结果与分析
4.4.1 数据集
4.4.2 对比算法
4.4.3 评估方法
4.4.4 结果与分析
4.4.5 收敛性和正则化参数λ
4.5 本章小结
结论
参考文献
攻读硕士学位期间发表的论文及其它成果
致谢
本文编号:3599648
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3599648.html