基于二阶隐马尔可夫模型的协同过滤算法的研究与应用
发布时间:2022-08-12 21:49
随着现代社会互联网的发展,信息资讯大量出现,这给用户在信息的选择上增加了困难。此时,以协同过滤为首的推荐技术逐渐引起了人们的关注。但是,现有的算法不可避免的存在着数据稀疏性以及过度依赖评分矩阵等局限性。在现有算法的基础上,本文利用隐马尔可夫模型里观测值与状态之间的双重随机性模拟用户的评分轨迹,从而对协同过滤的数据稀疏性进行改进,但是由于隐马尔可夫模型无后效性,它无法表示非相邻状态间的依赖关系,从而导致用户偏好中部分有用特征的丢失,该模型继承了一阶隐马尔可夫模型的优点,因此本文提出基于二阶隐马尔可夫模型的改进协同过滤算法,以及针对该算法的运行效率和用户可扩展问题而提出的聚类优化算法。最后应用本文提出的算法设计一套为大学生群体服务的信息资讯推荐原型系统。本文的主要研究工作如下:(1)针对现有的协同过滤算法中的数据稀疏性和过度依赖评分矩阵等问题,提出一种基于二阶隐马尔可夫模型的改进协同过滤算法(CF-2HMM)。该算法利用二阶隐马尔可夫模型中状态之间转移的随机性来模拟用户的兴趣变迁,根据用户的评分轨迹,找到用户下一时刻评分概率最高的项目候选集,缓解了数据稀疏性;并将获得的概率与余弦相似度加权...
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容
1.4 论文组织结构
第二章 研究相关的基础知识介绍
2.1 推荐算法
2.1.1 传统协同过滤推荐算法
2.1.2 基于模型的协同过滤推荐算法
2.2 隐马尔可夫模型
2.2.1 马尔可夫模型简介
2.2.2 隐马尔可夫模型
2.3 HMM的基本算法
2.3.1 HMM的三个基本问题
2.3.2 前向-后向算法
2.3.3 Viterbi算法
2.3.4 Baum-Welch算法
2.4 本章小结
第三章 基于二阶隐马尔可夫模型的改进协同过滤算法
3.1 问题描述
3.2 二阶隐马尔可夫模型
3.3 算法描述
3.3.1 模型参数
3.3.2 概率推理
3.3.3 参数估计
3.3.4 基于项目的协同过滤算法
3.3.5 算法整体流程
3.4 数值实验
3.4.1 实验环境和实验数据
3.4.2 实验评价指标
3.4.3 实验结果分析
3.5 本章小结
第四章 融合评分轨迹的用户聚类算法
4.1 基于K-Means用户聚类的CF-2HMM算法
4.2 融合评分轨迹的用户聚类算法(UCST)
4.2.1 融合评分轨迹的综合相似度
4.2.2 基于综合相似度的距离度量方法
4.2.3 优化的初始簇中心选择
4.2.4 算法整体流程
4.3 基于UCST的改进CF-2HMM算法(CF-2MHM-UCST)
4.4 数值实验
4.4.1 实验环境和实验数据
4.4.2 实验评价指标
4.4.3 实验结果分析
4.5 本章小结
第五章 信息资讯推荐原型系统设计与实现
5.1 系统需求分析
5.2 系统架构设计
5.2.1 系统架构图
5.2.2 系统数据库设计
5.3 推荐算法的应用
5.3.1 数据预处理
5.3.2 整体流程
5.4 核心功能实现
5.5 本章小结
第六章 总结与展望
6.1 本文总结
6.2 研究展望
参考文献
致谢
硕士期间研究成果
【参考文献】:
期刊论文
[1]新闻推荐算法:问题及优化策略[J]. 匡文波,陈小龙. 新闻与写作. 2018(04)
[2]基于二阶HMM的中医诊断古文词性标注[J]. 刘博,杜建强,聂斌,刘蕾,张鑫,郝竹林. 计算机工程. 2017(07)
[3]从“今日头条”看个性化新闻推荐系统的优劣[J]. 于黎冰. 传媒. 2016(19)
[4]概率图模型表示理论[J]. 刘建伟,黎海恩,罗雄麟. 计算机科学. 2014(09)
[5]狄拉克δ函数[J]. 徐玲玲,赵永芳,井孝功. 大学物理. 2010(08)
[6]一种改进Viterbi算法的应用研究[J]. 李荣,郑家恒. 计算机工程与设计. 2007(03)
[7]隐马尔可夫模型在生物信息学中的应用[J]. 杜世平. 大学数学. 2004(05)
[8]信息检索的概率模型[J]. 邢永康,马少平. 计算机科学. 2003(08)
[9]隐马尔可夫模型在语音识别中的应用[J]. 段红梅,汪军,马良河,徐冉. 工科数学. 2002(06)
[10]回溯算法的形式模型[J]. 王岩冰,郑明春,刘弘. 计算机研究与发展. 2001(09)
硕士论文
[1]基于协同过滤的信息推荐系统研究[D]. 郭世龙.北京邮电大学 2014
本文编号:3676655
【文章页数】:68 页
【学位级别】:硕士
【文章目录】:
摘要
abstract
第一章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 研究内容
1.4 论文组织结构
第二章 研究相关的基础知识介绍
2.1 推荐算法
2.1.1 传统协同过滤推荐算法
2.1.2 基于模型的协同过滤推荐算法
2.2 隐马尔可夫模型
2.2.1 马尔可夫模型简介
2.2.2 隐马尔可夫模型
2.3 HMM的基本算法
2.3.1 HMM的三个基本问题
2.3.2 前向-后向算法
2.3.3 Viterbi算法
2.3.4 Baum-Welch算法
2.4 本章小结
第三章 基于二阶隐马尔可夫模型的改进协同过滤算法
3.1 问题描述
3.2 二阶隐马尔可夫模型
3.3 算法描述
3.3.1 模型参数
3.3.2 概率推理
3.3.3 参数估计
3.3.4 基于项目的协同过滤算法
3.3.5 算法整体流程
3.4 数值实验
3.4.1 实验环境和实验数据
3.4.2 实验评价指标
3.4.3 实验结果分析
3.5 本章小结
第四章 融合评分轨迹的用户聚类算法
4.1 基于K-Means用户聚类的CF-2HMM算法
4.2 融合评分轨迹的用户聚类算法(UCST)
4.2.1 融合评分轨迹的综合相似度
4.2.2 基于综合相似度的距离度量方法
4.2.3 优化的初始簇中心选择
4.2.4 算法整体流程
4.3 基于UCST的改进CF-2HMM算法(CF-2MHM-UCST)
4.4 数值实验
4.4.1 实验环境和实验数据
4.4.2 实验评价指标
4.4.3 实验结果分析
4.5 本章小结
第五章 信息资讯推荐原型系统设计与实现
5.1 系统需求分析
5.2 系统架构设计
5.2.1 系统架构图
5.2.2 系统数据库设计
5.3 推荐算法的应用
5.3.1 数据预处理
5.3.2 整体流程
5.4 核心功能实现
5.5 本章小结
第六章 总结与展望
6.1 本文总结
6.2 研究展望
参考文献
致谢
硕士期间研究成果
【参考文献】:
期刊论文
[1]新闻推荐算法:问题及优化策略[J]. 匡文波,陈小龙. 新闻与写作. 2018(04)
[2]基于二阶HMM的中医诊断古文词性标注[J]. 刘博,杜建强,聂斌,刘蕾,张鑫,郝竹林. 计算机工程. 2017(07)
[3]从“今日头条”看个性化新闻推荐系统的优劣[J]. 于黎冰. 传媒. 2016(19)
[4]概率图模型表示理论[J]. 刘建伟,黎海恩,罗雄麟. 计算机科学. 2014(09)
[5]狄拉克δ函数[J]. 徐玲玲,赵永芳,井孝功. 大学物理. 2010(08)
[6]一种改进Viterbi算法的应用研究[J]. 李荣,郑家恒. 计算机工程与设计. 2007(03)
[7]隐马尔可夫模型在生物信息学中的应用[J]. 杜世平. 大学数学. 2004(05)
[8]信息检索的概率模型[J]. 邢永康,马少平. 计算机科学. 2003(08)
[9]隐马尔可夫模型在语音识别中的应用[J]. 段红梅,汪军,马良河,徐冉. 工科数学. 2002(06)
[10]回溯算法的形式模型[J]. 王岩冰,郑明春,刘弘. 计算机研究与发展. 2001(09)
硕士论文
[1]基于协同过滤的信息推荐系统研究[D]. 郭世龙.北京邮电大学 2014
本文编号:3676655
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3676655.html