基于用户特征的家庭电视节目个性化推荐研究
发布时间:2021-03-27 05:39
现今互联网的发展日新月异,网络中的数据量呈指数态势增加,随着数据的增加,数字电视和通信技术也得到了迅猛发展,电视节目数量与日俱增,这就导致用户在众多的电视节目中难以找到自己感兴趣的节目,这种情况在一定程度上会影响用户的收视体验与电视节目的收视率。因此,电视节目个性化推荐已成为了越来越多的用户和电视供应商的共同需求。首先,本文分析了现今电视节目个性化推荐中的国内外研究现状与面临的挑战,又介绍了电视节目个性化推荐中的核心——用户偏好模型的研究现状。在此基础上分析了现今主要的推荐系统模型以及聚类模型,并对两种模型的各种衍生模型进行了优缺点总结,这些研究为后面的电视节目个性化推荐算法的改进与设计打下了坚实的基础。然后,本文对用户机顶盒中数据进行了预处理,清洗掉数据中的异常值数据等,并进了统计分析,为后续进一步研究打下基础。接着本文构建了隐式评分矩阵,在之前学者进行的基于用户观看时长的隐式评分的基础上,本文加入了用户收视频率这一重要影响因素,构建了基于收视时长与收视频率结合的隐式评分矩阵,这个矩阵可以进一步提高构建算法的可解释性,并且为下一步推荐算法的设计与分析提供了坚实的数据保障基础。接着,由...
【文章来源】:昆明理工大学云南省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
基于用户的协同过滤系统示意图
昆明理工大学专业学位硕士学位论文14图2-2基于电视产品的协同过滤示意图两种协同过滤推荐算法在各种指标上的性能对比如表所示。表2-1算法性能对比表UserCFItemCF性能适用于用户较少的场合,如果用户过多,计算用户相似度矩阵的代价交大适用于电视产品数明显小于用户数的场合,如果电视产品很多,计算电视产品相似度矩阵的代价交大领域实效性要求高,用户个性化兴趣要求不高长尾产品丰富,用户个性化需求强烈实时性用户有新行为,不一定需要推荐结果立即变化用户有新行为,一定会导致推荐结果的实时变化冷启动在新用户对少的产品产生行为后,不能立即对他进行个性化推荐,因为用户相似度是离线计算的;新产品上线后一段时间,一旦有用户对产品产生行为,就可以将新产品推荐给其他用户新用户只要对一个产品产生行为,就能推荐相关产品给他,但无法在不离线更新产品相似度表的情况下将新产品推荐给用户(但是新的Item到来也同样是冷启动问题)推荐理由很难提供令用户信服的推荐解释可以根据用户历史行为归纳推荐理从上表分析可知,基于用户的协同过滤推荐在算法的实时性表现上十分优异当物品实时性较强的时候则用此方法较为合适。基于物品的个性化推荐比较适用于离线推荐,当推荐速度不是很急需的时候,基于物品的协同过滤推荐则有较大优势。
第二章理论知识19图2-3聚类算法分类图聚类算法作为机器学习中无监督算法的代表,在近些年被不断地开发与改进,以此来不断适应现今数据大爆炸的时代和越来越多需要聚类的业务场景。2.3.2kmeans算法简介在电视节目推荐领域中,首先电视机收视用户的数量就是一个极为庞大的基数,并且电视节目种类也是在逐年增加,因此这就导致了时间越长,电视节目数量就越多。因此在一开始设计算法的时候,就要首先选择算法时间复杂度低的算法进行采用。而在对电视节目的收视用户时聚类更是如此,因为电视节目收视用户注定了其人口基数就比较大,甚至全国大多数人民都有过观看电视节目的行为,而在现今的大多数聚类算法中,kmeans举了或者基于kmeans聚类的各种改进算法,其时间复杂度均较低,传统的kmeans聚类的算法时间复杂度为O(nkt),这个时间复杂度在众多聚类算法中是极小的一种,接近了线性时间复杂度,此种算法适用于大规模数据的聚类,并且算法结果易解释,正符合本数据集的要求。Kmeans算法首次被提出是在文献[33]中,作者是Macqueen,他首次提出了这种基于原型的无监督学习的聚类算法,该算法一经问世,迅速以其准确的聚类结果和快速的运行时间而被广泛使用,最终也成为数据分析与挖掘领域的十大经典算法之一。K-means算法的基本流程是将K个质心(这个质心的选取一般是根据人为经验,没有具体精确的数学推导公式)作为初始聚类中心,并根据k个质心来划分k个聚类区域,并将聚类中心附近的对象划分到该聚类中心所属的类别中,全部分配完毕之后再计算新的聚
本文编号:3102990
【文章来源】:昆明理工大学云南省
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
基于用户的协同过滤系统示意图
昆明理工大学专业学位硕士学位论文14图2-2基于电视产品的协同过滤示意图两种协同过滤推荐算法在各种指标上的性能对比如表所示。表2-1算法性能对比表UserCFItemCF性能适用于用户较少的场合,如果用户过多,计算用户相似度矩阵的代价交大适用于电视产品数明显小于用户数的场合,如果电视产品很多,计算电视产品相似度矩阵的代价交大领域实效性要求高,用户个性化兴趣要求不高长尾产品丰富,用户个性化需求强烈实时性用户有新行为,不一定需要推荐结果立即变化用户有新行为,一定会导致推荐结果的实时变化冷启动在新用户对少的产品产生行为后,不能立即对他进行个性化推荐,因为用户相似度是离线计算的;新产品上线后一段时间,一旦有用户对产品产生行为,就可以将新产品推荐给其他用户新用户只要对一个产品产生行为,就能推荐相关产品给他,但无法在不离线更新产品相似度表的情况下将新产品推荐给用户(但是新的Item到来也同样是冷启动问题)推荐理由很难提供令用户信服的推荐解释可以根据用户历史行为归纳推荐理从上表分析可知,基于用户的协同过滤推荐在算法的实时性表现上十分优异当物品实时性较强的时候则用此方法较为合适。基于物品的个性化推荐比较适用于离线推荐,当推荐速度不是很急需的时候,基于物品的协同过滤推荐则有较大优势。
第二章理论知识19图2-3聚类算法分类图聚类算法作为机器学习中无监督算法的代表,在近些年被不断地开发与改进,以此来不断适应现今数据大爆炸的时代和越来越多需要聚类的业务场景。2.3.2kmeans算法简介在电视节目推荐领域中,首先电视机收视用户的数量就是一个极为庞大的基数,并且电视节目种类也是在逐年增加,因此这就导致了时间越长,电视节目数量就越多。因此在一开始设计算法的时候,就要首先选择算法时间复杂度低的算法进行采用。而在对电视节目的收视用户时聚类更是如此,因为电视节目收视用户注定了其人口基数就比较大,甚至全国大多数人民都有过观看电视节目的行为,而在现今的大多数聚类算法中,kmeans举了或者基于kmeans聚类的各种改进算法,其时间复杂度均较低,传统的kmeans聚类的算法时间复杂度为O(nkt),这个时间复杂度在众多聚类算法中是极小的一种,接近了线性时间复杂度,此种算法适用于大规模数据的聚类,并且算法结果易解释,正符合本数据集的要求。Kmeans算法首次被提出是在文献[33]中,作者是Macqueen,他首次提出了这种基于原型的无监督学习的聚类算法,该算法一经问世,迅速以其准确的聚类结果和快速的运行时间而被广泛使用,最终也成为数据分析与挖掘领域的十大经典算法之一。K-means算法的基本流程是将K个质心(这个质心的选取一般是根据人为经验,没有具体精确的数学推导公式)作为初始聚类中心,并根据k个质心来划分k个聚类区域,并将聚类中心附近的对象划分到该聚类中心所属的类别中,全部分配完毕之后再计算新的聚
本文编号:3102990
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3102990.html
最近更新
教材专著