当前位置:主页 > 管理论文 > 移动网络论文 >

基于公共微博数据和收视行为数据的电视用户画像研究

发布时间:2021-05-18 08:50
  随着电视技术与互联网的高速发展,传统的单向接受信号的电视发生了巨大改变,人们现在可以在家中通过智能电视或者安装双向机顶盒来获取海量的电视节目,与此同时电视服务商也能够实时、准确的获取到电视用户所有操作数据。为了给电视用户推荐更符合用户口味的电视节目和更契合用户需求的广告,通过分析用户的收视行为数据构建准确的用户画像就显得至关重要。传统的电视用户画像方法一般先从电子节目表单系统(EPG)获得节目的标签,然后通过分析用户与电视节目的关系从而得到用户画像标签,但是由于EPG标签主观性太强、最后得到的标签覆盖面窄等原因而具有一定的局限性。本文针对如何使用公共微博数据提升电视用户画像的准确率进行了研究,其核心在于本文将处于不同平台的微博用户与电视用户相关联,使用准确的微博数据完成电视用户画像预测。具体工作内容包括:1)介绍了电视用户画像的背景与意义,研究并确认微博用户含有对电视节目关注的行为并且拥有准确的用户画像信息;2)设计了高效网络爬虫以获取微博数据,并使用分词算法、配置词典、TF-IDF从博文中挖掘出了微博用户关注电视节目的特征;3)对大量电视用户收视数据进行清洗,得到电视用户关注电视节目... 

【文章来源】:北京邮电大学北京市 211工程院校 教育部直属院校

【文章页数】:64 页

【学位级别】:硕士

【文章目录】:
摘要
ABSTRACT
第一章 绪论
    1.1 课题背景与意义
        1.1.1 电视用户画像的背景与意义
        1.1.2 使用公共微博数据的背景与意义
    1.2 课题研究现状
        1.2.1 微博的研究现状
        1.2.2 电视用户画像的研究现状
    1.3论文的研究内容
    1.4 论文的创新点
    1.5 论文的组织结构
第二章 相关技术
    2.1 微博数据抓取和清洗技术
        2.1.1 基于selenium的网络爬虫
        2.1.2 TF-IDF方法
    2.2 构建模型所需的分类算法
        2.2.1 决策树
        2.2.2 梯度提升决策树(Gradient Boosting Decision Tree)
第三章 收视数据与微博数据处理
    3.1 电视用户收视数据清洗
    3.2 微博爬虫实现
        3.2.1 多账号登录
        3.2.2 关键词搜索
        3.2.3 解析页面
    3.3 微博数据的清洗
第四章 电视用户画像研究
    4.1 电视用户画像标签的定义
    4.2 利用微博数据构建训练模型
        4.2.1 多标签分类问题
        4.2.2 基于微博数据的标签模型的构建
            4.2.2.1 性别标签模型构造
            4.2.2.2 年龄标签模型构造
            4.2.2.3 兴趣偏好标签模型构造
        4.2.3 使用xgboost构造模型
        4.2.4 实验证明标签与电视节目的相关性
    4.3 使用微博用户数据模型预测电视用户的用户画像
第五章 电视用户画像实验
    5.1 实验数据
    5.2 传统的基于EPG和TF-IDF的电视用户画像方法
    5.3 用户画像准确性评估方法
        5.3.1 Fepg评估方法
        5.3.2 Fweibo评估方法
        5.3.3 推荐成功率评估标准
    5.4 实验结果分析
第六章 总结与展望
    6.1 总结
    6.2 展望
参考文献
致谢
攻读学位期间取得的研究成果


【参考文献】:
期刊论文
[1]个性化推荐系统综述[J]. 刘辉,郭梦梦,潘伟强.  常州大学学报(自然科学版). 2017(03)
[2]微博用户的相似性度量及其应用[J]. 徐志明,李栋,刘挺,李生,王刚,袁树仑.  计算机学报. 2014(01)
[3]社交媒体+APP:传统电视开启电视互动新时代[J]. 张守信.  南方电视学刊. 2013(05)
[4]面向用户观点分析的多分类器集成和优化技术[J]. 林煜明,朱涛,王晓玲,周傲英.  计算机学报. 2013(08)
[5]基于Selenium的软件自动化测试的研究与应用[J]. 吴伶琳.  计算机与现代化. 2013(02)
[6]推荐系统评价指标综述[J]. 朱郁筱,吕琳媛.  电子科技大学学报. 2012(02)
[7]一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J]. 黄承慧,印鉴,侯昉.  计算机学报. 2011(05)
[8]基于决策树的电视节目收视率预测模型[J]. 涂娟娟,刘同明.  微计算机信息. 2007(27)

硕士论文
[1]基于用户兴趣的微博个性化信息推荐研究[D]. 林文旋.华南理工大学 2014



本文编号:3193506

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3193506.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户48069***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com