当前位置:主页 > 科技论文 > 自动化论文 >

基于网络行为的用户画像算法研究

发布时间:2021-05-24 07:12
  伴随着整个社会对互联网、特别是移动互联网的广泛接受,用户产生数据呈现爆发式增长。我们每天都会在网络上留下大量的行为数据,比如查询词、网页访问记录等,这些数据类型丰富、时效性强,为分析用户的爱好习惯及个人属性信息、构建用户画像模型,提供了充足的数据资源。用户画像是企业大数据的基础,充分利用用户行为记录数据,刻画出用户属性信息全貌,高效地构建用户画像,将有利于企业实现精准营销及个性化服务。传统人工给用户画像打标签的效率较低,所以借助算法模型来预测标签成为用户画像的一个热门研究方向。但是目前主流的机器学习算法未能深入挖掘特征间的复杂关系,在高维、稀疏特征时预测效果仍不尽人意,还存在较大提升空间。而混合算法往往能结合各算法的优点,一定程度上克服缺陷,提高预测精度。针对用户的查询记录数据,为了实现用户多维人口属性标签的预测任务,对用户画像构建方法进行了深入研究,研究工作总结如下:1)提出了一种基于随机森林算法的二层集成学习框架。在第一层模型中,基于6种传统的机器学习算法来作为用户查询词特征提取器,并与用户的数字特征相融合,作为第二层模型的输入;在第二层模型中,使用随机森林算法作为分类器,采用不同... 

【文章来源】:广东技术师范大学广东省

【文章页数】:60 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 用户网络行为画像研究现状
    1.4 论文研究内容及结构
2 相关理论技术及模型
    2.1 用户画像基础
        2.1.1 用户画像信息来源
        2.1.2 用户画像常用模型
    2.2 文本向量化常用模型
        2.2.1 TF-IDF模型
        2.2.2 词向量模型
        2.2.3 文档向量模型
    2.3 集成学习
        2.3.1 Bagging算法
        2.3.2 Boosting算法
        2.3.3 Stacking算法
    2.4 本章小结
3 基于随机森林算法的用户画像构建
    3.1 引言
    3.2 算法介绍
        3.2.1 逻辑回归算法
        3.2.2 支持向量机算法
        3.2.3 朴素贝叶斯算法
        3.2.4 主题模型
        3.2.5 随机森林算法
        3.2.6 基于随机森林算法的用户画像算法框架
    3.3 实验结果与分析
        3.3.1 实验环境及工具
        3.3.2 数据集
        3.3.3 预处理
        3.3.4 对比方法
        3.3.5 参数选择
        3.3.6 实验结果
    3.4 本章小结
4 基于XGBoost算法的用户画像算法框架
    4.1 引言
    4.2 算法介绍
        4.2.1 BPDM(BPNN based Doc2Vec Model)
        4.2.2 XGBoost算法
        4.2.3 基于XGBoost算法的用户画像算法框架
    4.3 实验结果与分析
        4.3.1 实验环境及工具
        4.3.2 数据集
        4.3.3 对比方法
        4.3.4 参数选择
        4.3.5 实验结果
    4.4 本章小结
5 总结与展望
    5.1 全文总结
    5.2 未来展望
参考文献
致谢
攻读硕士学位期间取得的研究成果
学位论文数据集表


【参考文献】:
期刊论文
[1]基于朴素贝叶斯的农业文本分类方法研究[J]. 赵燕,李晓辉,周云成,张越.  节水灌溉. 2018(02)
[2]贝叶斯网络在用户画像构建中的研究[J]. 张小可,沈文明,杜翠凤.  移动通信. 2016(22)
[3]基于大数据的个人信用风险评估关键技术研究[J]. 林汉川,张万军,杨柳.  管理现代化. 2016(02)
[4]手机用户画像在大数据平台的实现方案[J]. 张慷.  信息通信. 2014(02)
[5]人类行为的动力学与统计力学研究[J]. 汪秉宏,韩筱璞.  物理. 2010(01)

博士论文
[1]基于社交大数据的用户信用画像方法研究[D]. 郭光明.中国科学技术大学 2017
[2]面向个性化服务的User Profile研究及应用[D]. 杜卿.华南理工大学 2014
[3]在线社会网络用户行为模型与应用算法研究[D]. 肖云鹏.北京邮电大学 2013
[4]网络用户行为分析的若干问题研究[D]. 刘鹏.北京邮电大学 2010

硕士论文
[1]基于Web日志的用户行为大数据分析[D]. 宋芷萱.沈阳师范大学 2018
[2]基于深度神经网络的用户画像研究[D]. 周妹璇.湖南大学 2018
[3]用户画像构建中知识表示与模型融合研究[D]. 李恒超.大连理工大学 2017
[4]基于集成SVM的文本分类方法研究[D]. 游攀利.华中科技大学 2014
[5]人机交互中用户建模方法的研究[D]. 李荣.南京师范大学 2004



本文编号:3203782

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3203782.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b39db***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com