基于时段-时长耦合LDA的用户收视行为挖掘
发布时间:2024-06-14 22:23
网络协议电视(IPTV)的用户收视兴趣不仅体现在用户观看的节目列表,还体现在节目的观看时间点和时长上。考虑到现有方法对时间点和时长的忽略,提出一种时段-时长耦合的LDA模型。通过刻画用户兴趣主题和收视时段的隐变量生成收视记录中的观看节目、观看时间点和时长,并用Gibbs采样对上述隐变量进行推断。在天津电视台用户行为数据上进行验证,结果表明,该模型可以得到节目相关性更高的兴趣主题,更加精确地挖掘到用户在不同时段的收视兴趣分布。将该模型用于IPTV节目推荐,相较于传统的cLDA,推荐效果有显著提升。
【文章页数】:9 页
【部分图文】:
本文编号:3994509
【文章页数】:9 页
【部分图文】:
图1LDA概率图模型
LDA是Blei等学者于2003年提出的一种基于概率模型的文本主题建模方法,可以识别庞大文档集或语料库中的隐藏主题信息,被广泛应用于信息检索、自然语言处理等领域[13~15]。LDA的图模型如图1所示,该模型假设文章是由多个主题以不同比例混合而成,每个主题可以用多个词的概率分布表....
图2用户收视记录的周期性变化
(4)用户对某个节目的观看时长越长,则对这个节目的喜爱程度越高。基于上述分析,本文将LDA模型中的兴趣主题分布θm扩展为表示用户收视兴趣、时段与时长的行为模式分布,建立TDC-LDA模型。表2是LDA模型推广到TDC-LDA模型后θm的变化。在LDA模型中,每个IPTV用户的兴....
图3TDC-LDA概率图模型
TDC-LDA模型是一个概率生成模型,它是对LDA模型的拓展,模型如图3所示。假设有K个兴趣主题,Vm个不同的电视节目,兴趣主题对应的电视节目多项式分布描述成K×Vm维的矩阵Φ,φk,vw是节目vm属于主题k的概率。同样,假设有L个时段(时段指一些特定的时间区间,例如,工作日17....
图6用户M观看最多的5个节目的观看次数与时长
表9用户M的兴趣主题概率分布模型兴趣主题动画I类动画II类古装爱情类cLDA0.7585140.05804950.003096TDC-LDA0.5554180.06037150.212454分析图6可知用户M是一个以儿童与家庭主妇主导收....
本文编号:3994509
本文链接:https://www.wllwen.com/kejilunwen/wltx/3994509.html