基于移动用户观影记录的推荐系统研究
发布时间:2021-12-11 08:59
随着移动设备的广泛使用以及视频网站资源的海量增长,移动端观影越来越流行。移动设备观看影片具有受时间、地点影响小,成本低等优点,但是爆炸式增长的影片资源使得用户难以快速做出有效、准确的观影选择。因此,建立个性化视频推荐系统给予用户优质的观影服务是提高用户的满意度和视频网站的收入的关键。针对上述问题,本文基于运营商提供的用户观影记录和网络影片内容信息对于用户移动观影行为进行研究,取得以下创新性成果:提出一种基于影片客观信息的电影评分类别预测方法。利用知识图谱和自然语言处理领域方法处理影片结构化信息和简介信息,并使用深度神经网络自动学习信息向量特征构建评分类别预测模型。在电影评分三分类预测问题上取得62.1%的准确率和63.9%的F1-micro值,性能优于未改进的Trans R方法和单一信息源模型。最后该模型成功实现“新影片”的评分预测,有效解决新影片评分“冷启动”问题。提出一种结合用户观影记录和影片内容信息的混合推荐模型。该模型在传统协同过滤方法的基础上,加入了影片结构化信息、影片简介信息和影片评论信息等辅助信息,并且利用注意力机制处理不同用户评论。上述信息特征由神经网络自动学习,无需手...
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
《复仇者联盟3》影片结构化数据
浙江大学硕士学位论文数据获取及数据集8图2.2《复仇者联盟3》影片结构化数据2.2.2影片简介数据影片的简介通常表达了影片的主题。如果可以把影片看成讲述一个故事,那么简介内容就是对于“故事性”的最精炼描述。以影片《复仇者联盟3》为例,如图2.3所示,简介介绍了《复仇者联盟3》的故事背景以及主要故事线,是对于影片内容描述的重要语料来源。图2.3《复仇者联盟3》影片简介2.2.3影片评论数据影片社区网站的每一部影片都有很多用户关于这部影片的评价信息,分为长评和短评,这个部分的信息可以作为用户对于影片的情感分析的语料来源以及影片内容的主观描述。本文主要使用短评,以《复仇者联盟3》为例,如图2.4所示,用户的短评包含了用户观影的情感倾向,用以分析用户的观影行为从而可以
浙江大学硕士学位论文数据获取及数据集9更精准的进行影片推荐。一共获得了58万部影片的评论条数总计2200万条,部分热门影片评论条数较多,也存在很多影片没有评论的情况。图2.4《复仇者联盟3》影片短评数据2.3观影数据集本文数据来源于运营商用户某一个月的观影记录,观影人数共一千多万,影片数目近三万部,观影交互记录共五千余万条。平均每个用户的观影记录约为4条,这说明大多数人并不是每天都会进行移动端观影行为。若研究全部数据,其中很多不活跃的用户和影片会造成推荐的“冷启动”问题,且生成的“用户-影片”交互矩阵十分庞大和稀疏,计算量巨大。因此利用Spark计算框架[36]筛选出观影最频繁的5000名用户和1000部电影生成观影数据集。通过研究交互频繁的用户和影片来代表整体的观影倾向并做出推荐。最终结合影片信息的观影数据集统计于表2.1所示。
【参考文献】:
期刊论文
[1]融媒体时代电影评分对电影传播的影响[J]. 高路. 电影文学. 2018(19)
[2]基于网络用户评论的评分预测模型研究[J]. 张红丽,刘济郢,杨斯楠,徐健. 数据分析与知识发现. 2017(08)
本文编号:3534389
【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
《复仇者联盟3》影片结构化数据
浙江大学硕士学位论文数据获取及数据集8图2.2《复仇者联盟3》影片结构化数据2.2.2影片简介数据影片的简介通常表达了影片的主题。如果可以把影片看成讲述一个故事,那么简介内容就是对于“故事性”的最精炼描述。以影片《复仇者联盟3》为例,如图2.3所示,简介介绍了《复仇者联盟3》的故事背景以及主要故事线,是对于影片内容描述的重要语料来源。图2.3《复仇者联盟3》影片简介2.2.3影片评论数据影片社区网站的每一部影片都有很多用户关于这部影片的评价信息,分为长评和短评,这个部分的信息可以作为用户对于影片的情感分析的语料来源以及影片内容的主观描述。本文主要使用短评,以《复仇者联盟3》为例,如图2.4所示,用户的短评包含了用户观影的情感倾向,用以分析用户的观影行为从而可以
浙江大学硕士学位论文数据获取及数据集9更精准的进行影片推荐。一共获得了58万部影片的评论条数总计2200万条,部分热门影片评论条数较多,也存在很多影片没有评论的情况。图2.4《复仇者联盟3》影片短评数据2.3观影数据集本文数据来源于运营商用户某一个月的观影记录,观影人数共一千多万,影片数目近三万部,观影交互记录共五千余万条。平均每个用户的观影记录约为4条,这说明大多数人并不是每天都会进行移动端观影行为。若研究全部数据,其中很多不活跃的用户和影片会造成推荐的“冷启动”问题,且生成的“用户-影片”交互矩阵十分庞大和稀疏,计算量巨大。因此利用Spark计算框架[36]筛选出观影最频繁的5000名用户和1000部电影生成观影数据集。通过研究交互频繁的用户和影片来代表整体的观影倾向并做出推荐。最终结合影片信息的观影数据集统计于表2.1所示。
【参考文献】:
期刊论文
[1]融媒体时代电影评分对电影传播的影响[J]. 高路. 电影文学. 2018(19)
[2]基于网络用户评论的评分预测模型研究[J]. 张红丽,刘济郢,杨斯楠,徐健. 数据分析与知识发现. 2017(08)
本文编号:3534389
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3534389.html
最近更新
教材专著