基于行为和视频评论的移动用户画像

发布时间:2021-05-19 02:54
  随着移动互联网的发展,越来越多的用户通过移动终端,使用数据流量观看视频。用户在观看移动视频的同时,产生了大量的行为数据。从用户的行为数据中分析用户的属性信息,挖掘用户的兴趣和偏好,会帮助网络运营商和视频提供商改进服务质量。本文提出了一种基于用户行为数据和视频评论文本的移动用户画像构建方案。该方案不依赖特征工程准确预测用户的个人属性,并且设计了层次标签体系描述用户的兴趣偏好。提出了一种共嵌入注意力网络模型用于预测用户的年龄和性别。该模型首先分别从用户观看记录和视频评论文档中,学习视频的观看向量和评论向量;之后结合两个向量作为视频特征,并引入注意力机制,构建共嵌入注意力网络;最后将用户的视频观看记录输入到网络中预测用户的属性信息。在性别预测和年龄预测两个任务中,共嵌入注意力网络分别取得了91.6%和56.4%的F1-score。提出了一种视频的粗粒度标签获取算法。该算法构建了层次注意力网络,学习评论文本中单词和评论的权重;最后预测所有标签的置信度并确定视频的一级标签。此外还提出了基于文档重构的样本均衡法,解决样本分布不均衡问题的同时利用了更多的文本信息。视频粗粒度标签获取算法在标签推荐任务... 

【文章来源】:浙江大学浙江省 211工程院校 985工程院校 教育部直属院校

【文章页数】:76 页

【学位级别】:硕士

【文章目录】:
致谢
摘要
Abstract
第1章 绪论
    1.1 研究背景
    1.2 研究现状
        1.2.1 用户属性画像的研究现状
        1.2.2 标签推荐算法的研究现状
    1.3 论文的主要研究内容
    1.4 论文的组织结构
第2章 数据集
    2.1 移动视频用户数据
        2.1.1 移动端用户视频观看数据
        2.1.2 移动端用户属性特征数据
    2.2 视频文本数据
第3章 移动视频用户属性画像
    3.1 视频特征向量训练
        3.1.1 基于skip-gram和用户观看序列的视频嵌入
        3.1.2 基于Doc2Vec和视频评论文本的视频嵌入
        3.1.3 视频特征向量生成
        3.1.4 用户特征画像构建
    3.2 共嵌入注意力网络
        3.2.1 网络模型框架
        3.2.2 门控循环单元
        3.2.3 注意力机制层
        3.2.4 全连接输出层
    3.3 实验设置和结果分析
        3.3.1 实验设置
        3.3.2 实验结果与分析
        3.3.3 视频嵌入对比实验
        3.3.4 注意力机制可视化
    3.4 本章小结
第4章 移动视频用户兴趣画像
    4.1 基于层次注意力网络的视频一级标签分类
        4.1.1 基于文档重构的样本均衡
        4.1.2 层次注意力网络
        4.1.3 基准模型介绍
        4.1.4 实验设置与结果分析
    4.2 基于融合标签抽取算法的视频二级标签提取
        4.2.1 基于TF-IDF的关键词提取
        4.2.2 基于Text Rank的关键词提取
        4.2.3 基于融合标签抽取算法的关键词提取
    4.3 基于视频层次标签体系的用户兴趣画像构建
    4.4 本章小结
第5章 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读硕士学位期间主要的研究成果
作者简历



本文编号:3194974

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3194974.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a4f85***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com