基于主题模型的多标签文本分类及推荐系统若干问题研究
发布时间:2021-01-18 00:39
在互联网高速发展的今天,海量的信息通过互联网进行发布、传播,政治、经济、娱乐、教育、文化、学术论文等各行各业的信息,以文字、图像、声音、视频、结构化文档等多种形式进行发布,同时也在系统中进行数字化存储。信息量的不断增加提升了信息检索的难度,也对信息的有序管理提出更高的挑战。这就需要更加有效的方法和工具以高效地、自动地完成海量信息的组织、理解、检索,提高信息的利用效率和精准度,减少信息利用难度。多标签分类是对文本、图片、视频、结构化文档等信息资源进行组织和利用的有效方法。基于多标签的自动分类技术能够提高信息的处理效率,节约人工处理成本,改善用户使用体验,近年来已得到了广泛的关注,已成为信息检索与数据挖掘研究领域的热点方向。以LDA为代表的主题模型方法是对文本信息进行自动组织和归纳的有效方法,能够揭示文档的潜在语义,能够分析海量信息中蕴藏的主题,是重要的文本自动化处理技术,已在多标签文本分类、推荐系统等多个领域中得到广泛的应用。本文主要研究基于主题模型的有监督多标签文本分类方法和结合主题模型的个性化推荐方法。1、经典的多标签文本分类L-LDA和Dependency-LDA模型,忽略了词项的...
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:98 页
【学位级别】:博士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 主题模型研究现状
1.2.2 多标签文本分类研究现状
1.2.3 社会化标签推荐研究现状
1.3 本文研究重点和工作内容
第2章 相关背景知识
2.1 词语表示模型
2.1.1 One-Hot
2.1.2 基于频率的词嵌入
2.1.3 分布式词向量
2.2 主题模型
2.2.1 LSI模型
2.2.2 PLSI模型
2.2.3 LDA模型
2.3 多标签文本分类
2.4 主题模型学习算法
2.4.1 变分推断和参数估计
2.4.2 Gibbs采样和参数估计
2.5 多标签文本分类的有监督主题模型
2.5.1 L-LDA
2.5.2 Dependency-LDA
2.6 推荐系统
2.6.1 推荐系统的构成
2.6.2 基于协同过滤的推荐方法
2.6.3 基于内容的推荐方法
2.6.4 混合推荐方法
2.7 小结
第3章 基于主题模型的多标签文本分类
3.1 概述
3.2 词项权重设置
3.3 WL-LDA模型
3.3.1 模型训练
3.3.2 模型测试
3.4 WD-LDA模型
3.4.1 模型训练
3.4.2 模型测试
3.5 实验
3.5.1 实验设置
3.5.2 与基线算法比较
3.5.3 参数实验
3.6 本章小结
第4章 结合主题模型的个性化标签推荐方法
4.1 概述
4.2 SIM-LDA-TAG模型
4.2.1 问题定义
4.2.2 推荐模型
4.3 LDA过程
4.4 实验
4.4.1 数据集
4.4.2 基线算法
4.4.3 评估度量
4.4.4 结果评价
4.5 本章小结
第5章 结合主题模型的个性化资源推荐方法
5.1 概述
5.2 SIM-LDA模型
5.2.1 问题定义
5.2.2 推荐模型
5.3 LDA过程
5.4 实验
5.4.1 数据集
5.4.2 基线算法
5.4.3 评估度量
5.4.4 结果评价
5.5 本章小结
第6章 结论与展望
6.1 本文总结
6.2 工作展望
参考文献
作者简介及在学期间所取得的科研成果
致谢
本文编号:2983913
【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校
【文章页数】:98 页
【学位级别】:博士
【文章目录】:
摘要
abstract
第1章 绪论
1.1 研究背景与意义
1.2 国内外研究现状
1.2.1 主题模型研究现状
1.2.2 多标签文本分类研究现状
1.2.3 社会化标签推荐研究现状
1.3 本文研究重点和工作内容
第2章 相关背景知识
2.1 词语表示模型
2.1.1 One-Hot
2.1.2 基于频率的词嵌入
2.1.3 分布式词向量
2.2 主题模型
2.2.1 LSI模型
2.2.2 PLSI模型
2.2.3 LDA模型
2.3 多标签文本分类
2.4 主题模型学习算法
2.4.1 变分推断和参数估计
2.4.2 Gibbs采样和参数估计
2.5 多标签文本分类的有监督主题模型
2.5.1 L-LDA
2.5.2 Dependency-LDA
2.6 推荐系统
2.6.1 推荐系统的构成
2.6.2 基于协同过滤的推荐方法
2.6.3 基于内容的推荐方法
2.6.4 混合推荐方法
2.7 小结
第3章 基于主题模型的多标签文本分类
3.1 概述
3.2 词项权重设置
3.3 WL-LDA模型
3.3.1 模型训练
3.3.2 模型测试
3.4 WD-LDA模型
3.4.1 模型训练
3.4.2 模型测试
3.5 实验
3.5.1 实验设置
3.5.2 与基线算法比较
3.5.3 参数实验
3.6 本章小结
第4章 结合主题模型的个性化标签推荐方法
4.1 概述
4.2 SIM-LDA-TAG模型
4.2.1 问题定义
4.2.2 推荐模型
4.3 LDA过程
4.4 实验
4.4.1 数据集
4.4.2 基线算法
4.4.3 评估度量
4.4.4 结果评价
4.5 本章小结
第5章 结合主题模型的个性化资源推荐方法
5.1 概述
5.2 SIM-LDA模型
5.2.1 问题定义
5.2.2 推荐模型
5.3 LDA过程
5.4 实验
5.4.1 数据集
5.4.2 基线算法
5.4.3 评估度量
5.4.4 结果评价
5.5 本章小结
第6章 结论与展望
6.1 本文总结
6.2 工作展望
参考文献
作者简介及在学期间所取得的科研成果
致谢
本文编号:2983913
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2983913.html