当前位置:主页 > 管理论文 > 移动网络论文 >

行为序列模式识别在泛娱乐平台用户兴趣发现中的应用

发布时间:2020-08-08 22:00
【摘要】:泛娱乐是现阶段互联网发展的重要特征之一,移动互联网泛娱乐化的趋势,激活了用户固有的、旺盛的娱乐社交需求。用户在产品使用过程中产生了大量日志,包含了一切行为的时间、地点、内容、互动、消费等信息,企业如何充分利用用户在其产品上留下的海量日志,运用数据挖掘技术,对用户进行深刻洞察,挖掘用户属性,揣摩用户的喜好,提取出对企业有价值的信息,以实现平台效益的最大化,也成为了工业界和学术界一个热点研究话题。带有时序信息的行为日志,又称为行为路径,蕴含了用户跳转习惯、路径偏好等有价值的信息,为了引导用户持续深入体验产品的价值,最大限度的激发用户兴趣,互联网行业普遍采用用户行为路径分析方法,该方法又可以称为行为序列模式挖掘,是一种将序列挖掘技术与用户行为路径相结合,探索行为规律,发现兴趣模式,从而获知产品使用情况,找到优化方向的分析方法。本文积极探索了行为序列模式识别技术在用户兴趣发现中的应用,从挖掘偏好路径、提取关键功能点、分析低活跃用户特征三个角度,构建了一个多层次用户兴趣分析体系,并以某泛娱乐平台的用户真实行为数据为基础,通过实验,论证了该体系的可行性,具体工作如下。首先提出了有效行为和有效序列的概念,并据此完成了数据清洗和整理,形成了供后续分析的基础数据,然后从序列长度、行为种类等角度进行了基本的数据探索和特征分析。其次,基于隐马尔可夫模型的参数估计问题,设计实验,进行了用户兴趣模式的挖掘。实验根据序列长度将基础数据进行了分组,并且为了保证模型科学训练,不被分布差异过大的数据所误导,本文还提出了针对性的分层采样方案。在结果评估阶段,基于已知行为所属场景天然属于隐藏状态的事实,设计出了隐藏状态准确率的指标,利用该指标挑选出了较优模型,进而模拟出最可能的行为路径,从这些模拟的路径中发现出了用户的路径偏好规律,并说明了这些模拟序列在兴趣发现中的实际指导意义。然后,为了解决泛娱乐平台中重要功能的发现问题,本文基于数学领域中图论的思想,提出了以行为为节点,以行为的跳转关系为边构建图的方案,将问题抽象成为图论中的关键节点发现问题。在关键节点发现的方案中,选用了三种从不同角度刻画节点重要性的指标。在实验分析阶段,利用不同序列长度的分组数据,分别进行了图形的构建和关键节点的发现,并在每个指标下得出了头部的结果,通过对比不同组别和不同指标的结果,给出了对系统起到重要作用的功能,并针对这个结果对产品提出了优化建议,证明了该场景下图模型的可行性。最后,聚焦于泛娱乐生态促活问题,设计了对比实验,将平台的低活跃用户和高活跃用户的行为序列进行对比,以高活跃的数据指标作为参考,观察指标为界面跳出率和界面退出率,提出了用于衡量两组数据差异度的指标比例差值。针对跳出率和退出率,选取比例差值大于阈值的行为界面作为实验结果。然后从实际业务出发,解释了这些界面对用户流失造成了哪些具体的影响,并给出了优化方案,最后还提出了其他针对性的的促活建议。
【学位授予单位】:对外经济贸易大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.09;O211.61
【图文】:

领域,社交,移动互联网


第 1 章 引言1.1 研究背景随着移动互联网技术的高速发展和大众对娱乐的需求日趋多元化,手机 App领域涌现出了很多综合性泛娱乐平台,它们集游戏、视频、社交、电商等功能为一体,旨在打造一个内容多样,用户粘性较高的大生态。可以说,泛娱乐是现阶段互联网发展的重要特征之一,图 1.1 是易观(一家中国大数据公司)在《2018网络社交泛娱乐化新趋势专题分析》中关于泛娱乐影响力的数据展示,可以看到,社交、视频等泛娱乐应用相较于其他应用,明显具有更多的活跃用户,且在最受欢迎的社交网络领域,单 2 月用户使用时长就超过了 300 亿小时。说明整个移动互联网泛娱乐化趋势,确实是激活了用户固有的、旺盛的娱乐社交需求。

论文结构


作为后续研究内容的基础,介绍论文研究数据基于真实的用户数据,说明了日志采集手段,序列的建立方式,解释了各字段含义,并对数据进行了探索,分析了关键特征的分布。第三章,用户兴趣模式发现,主要介绍了用户行为序列分析模型 HMM,说明其基本理论及优化算法,之后进行了实验,训练出最佳模型,并推演出了有意义的行为序列。用结果验证了该模型在兴趣模式发现中的可行性和有效性。第四章,关键功能点提取,主要介绍了图论领域的相关理论,定义了节点发现指标,之后进行了分组实验,从结果对比中,提炼出了关键行为节点,验证了图论在行为节点发现中的可行性及有效性,并依据实验结果给出了节点优化建议。第五章,用户促活问题探讨,针对活跃度较低的用户,定义关键指标,比较其与高活跃用户差异较大的地方,并进行了实验分析,依据实验结果提出了有针对性的用户促活方案。第六章,对全文工作进行了总结,指出了本文的一些不足之处,并对未来工作进行了展望。

序列,序列数,行为,种类分布


图 2.1 序列长度分布2.3.2 行为种类分布序列是由行为构成的,行为种类分布的意思是,对于某种行为,它出现在了多少条序列中,包含它的的序列数量越多,就代表它被访问的越普遍,越高频。图 2.2 比较了包含不同行为种类的序列数,从中可以看出<看他人资料,发个人消息,看他人动态,动态详情>属于高频高覆盖的几种行为,大部分的序列都包含这些行为,而包含其他的行为的序列数量相对较少,为了使研究能覆盖到全部的行为,后续的研究过程要注意这个特点。

【参考文献】

相关期刊论文 前5条

1 丁振国;宋薇;李婧;;基于序列模式挖掘的社交网络用户行为分析[J];现代情报;2013年03期

2 孙秀娟;金民锁;陈孝国;;基于隐马尔科夫模型的浏览兴趣预测[J];科技导报;2009年18期

3 褚红丹;焦素云;马威;;用户访问兴趣路径挖掘方法[J];计算机工程与应用;2008年35期

4 夏明波;王晓川;孙永强;金士尧;;序列模式挖掘算法研究[J];计算机技术与发展;2006年04期

5 邢东山,沈钧毅,宋擒豹;从Web日志中挖掘用户浏览偏爱路径[J];计算机学报;2003年11期

相关博士学位论文 前1条

1 陆海霞;线上评论感知有用性对购买意愿变化和购买行为的影响研究[D];吉林大学;2016年

相关硕士学位论文 前5条

1 林布锴;MOOCs用户阅读行为的频繁模式挖掘的研究及应用[D];广东工业大学;2017年

2 冯路;海量用户行为序列中的模式发现及应用[D];电子科技大学;2017年

3 杨宇佳;基于序列模式挖掘的移动应用使用预测研究[D];浙江大学;2016年

4 肖扬;序列挖掘算法研究及其在用户行为分析中的应用[D];北京邮电大学;2014年

5 程光曦;SNS中用户生成内容和行为数据的分析与应用[D];北京邮电大学;2010年



本文编号:2786168

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2786168.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户528cf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com