当前位置:主页 > 管理论文 > 移动网络论文 >

基于WEB日志的用户画像及可视化分析

发布时间:2021-09-24 09:34
  随着互联网产业的蓬勃发展,用户对网站建设提出了更高的要求.然而,经常因为网站设计给用户操作带来不便,致使用户体验变差,最终铮致客户流失,软件生命周期变短。若要设计出高质量使用户满意的软件,就需要根据用户的真实行为反馈,了解用户的行为习惯,有针对性的对网站进行优化设计。本文以教育统计平台为研究背景,针对网站设计中存在的功能展示不明确、组织结构混乱等问题,提出了构雄用户画像的方法。根据画像结果为设计者提供建议,解决网站设计中存在的问题,优化设计,提高用户体验。主要研究如下:(1)用户行为的建模。本文使用序列模式挖掘方法中的PrefixSpan算法对用户的行为轨迹进行挖掘。由于该算法在构造投影数据库时要占用大量的时间和空间,因此本文针对以上缺陷设计了PW算法,该算法增加了支持度和页面权重的双重过滤。经实验验证,PW算法在时间效率和精确率上优于PrefixSpan算法。(2)标签权重的计算。在序列模式算法挖掘出用户行为后,将实验结果保存到文本中作为标签权重算法的输入。本文对计算标签权重的TF-IDF和BM25算法的精确率、召回率和F1值进行对比分析,实验结果表明,BM25算法的综合性能优于TF... 

【文章来源】:西安理工大学陕西省

【文章页数】:72 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 选题背景及意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 用户画像在国内外研究现状
    1.3 主要研究内容
    1.4 本文组织结构
2 相关理论与技术应用研究
    2.1 WEB挖掘技术概述
    2.2 用户画像概述
    2.3 构建用户画像
        2.3.1 用户画像的建模方法
        2.3.2 多维度刻画用户画像
        2.3.3 标签体系的建立
        2.3.4 构建用户画像流程
    2.4 评估用户画像
    2.5 数据可视化
    2.6 本章小结
3 基于WEB日志的用户行为建模方法研究
    3.1 实验环境和数据
    3.2 序列模式挖掘算法分析
    3.3 用户行为建模
        3.3.1 PrefixSpan算法描述
        3.3.2 PrefixSpan算法优化
        3.3.3 PrefixSpan与 PW算法分析
    3.4 实验结果与分析
        3.4.1 实验数据处理
        3.4.2 时间效率对比
        3.4.3 精准度对比
        3.4.4 用户行为序列结果分析
    3.5 本章小结
4 计算标签权重方法研究
    4.1 标签权重算法分析
    4.2 计算标签权重
        4.2.1 TF-IDF算法描述
        4.2.2 BM25 算法描述
        4.2.3 TF-IDF和 BM25 算法分析
    4.3 算法评价指标
    4.4 实验结果与分析
        4.4.1 实验数据处理
        4.4.2 精确率对比
        4.4.3 召回率对比
        4.4.4 F1 值对比
        4.4.5 用户标签权重结果分析
    4.5 用户行为可视化分析
        4.5.1 活跃度信息数据可视化
        4.5.2 偏好信息数据可视化
        4.5.3 位置信息数据可视化
    4.6 本章小结
5 用户画像在教育统计平台中的应用
    5.1 搭建用户画像应用系统
        5.1.1 系统概述
        5.1.2 数据库设计
        5.1.3 主要功能模块
    5.2 教育统计平台的用户画像
        5.2.1 用户画像标签体系
        5.2.2 用户画像的结果展示
        5.2.3 用户画像的应用
    5.3 用户画像的验证
    5.4 本章小结
6 总结与展望
    6.1 全文总结
    6.2 未来展望
致谢
参考文献
攻读硕士学位期间研究成果


【参考文献】:
期刊论文
[1]面向攻击识别的威胁情报画像分析[J]. 杨沛安,刘宝旭,杜翔宇.  计算机工程. 2020(01)
[2]用户异常行为分析方法研究与应用[J]. 赖建华,唐敏.  软件导刊. 2019(08)
[3]基于动态精准画像的图书馆个性化推荐服务研究[J]. 张锐.  情报探索. 2019(02)
[4]内部威胁检测中用户行为模式画像方法研究[J]. 郭渊博,刘春辉,孔菁,王一丰.  通信学报. 2018(12)
[5]基于用户动态画像的科技情报服务推荐模型构建研究[J]. 王益成,王萍.  情报理论与实践. 2019(04)
[6]在线社交活动中的用户画像及其信息传播行为研究[J]. 刘海鸥,孙晶晶,张亚明,赵攀.  情报科学. 2018(12)
[7]基于读者用户画像的高校图书馆精准化服务研究[J]. 李雅.  农业图书情报学刊. 2018(12)
[8]基于云模型理论的群体用户画像模型[J]. 姚龙飞,何利力.  计算机系统应用. 2018(06)
[9]基于动态用户画像的信息推荐研究[J]. 刘勇,吴翔宇,解本巨.  计算机系统应用. 2018(06)
[10]大数据可视化工具比较及应用[J]. 陈小燕,干丽萍,郭文平.  计算机教育. 2018(06)

硕士论文
[1]基于用户画像特征数据集的个性化推荐算法研究[D]. 张颖.西安电子科技大学 2018
[2]基于大数据技术的用户画像系统的设计与研究[D]. 关梓骜.北京邮电大学 2018
[3]基于ECharts的数据可视化实现[D]. 裴丹丹.北京邮电大学 2018
[4]对TF-IDF算法的改进及实验研究[D]. 何晓静.吉林大学 2017
[5]大数据背景下用户画像的统计方法实践研究[D]. 李映坤.首都经济贸易大学 2016
[6]面向自然语言查询的知识搜索关键技术研究[D]. 黄鹏程.浙江大学 2016



本文编号:3407523

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3407523.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户2503c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com