在线用户兴趣演化研究
发布时间:2020-12-12 01:15
用户在网络中的点击和跳转可以看作是在虚拟空间中的移动,该行为往往受到兴趣的驱使,尽管人们在人类时空行为动力学的研究中取得了诸多突破性进展,但是对于虚拟空间中人类兴趣的动态演变却知之甚少,部分原因来自人类兴趣具有抽象内隐性,难以从观察中获得内心所想,难以获得足够的展现人类兴趣的行为数据。本文基于中国互联网信息中心提供的海量在线用户行为数据,将在线用户点击的每个网站当作是一个兴趣点,研究了虚拟空间中用户的兴趣演化模式。主要研究工作总结为以下三个方面:1、针对在线用户兴趣难以量化的问题,本文提出了兴趣粘性度量算法。从连续移动步长,返回步长,停驻时间等多个方面对在线用户兴趣行为进行实证分析,揭示出人类在线行为存在幂律的无标度特征。基于分析结果,提出了衡量兴趣点对用户吸引程度的兴趣粘性度量算法,通过与PageRank算法、注意力流模型实验对比,验证变量和算法的有效性。2、为了度量网络空间中兴趣点的相似性,研究兴趣点之间的跳转规律,本文提出了基于空间位置的兴趣点相似性算法。优化SPA模型,由节点的入度推导出节点产生时间和影响范围半径两个变量,引入兴趣粘性这一行为变量,使网络中的兴趣节点可以由这三个...
【文章来源】:西北师范大学甘肃省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
在线用户点击日志样例
西北师范大学硕士学位论文13入概念稳定性。定义5稳定性:是对一个网站连续移动步长变化的锐度的估计,由式(2-8)给出:1()()tnipipilog==(2-8)其中,n表示不同移动步长的个数,t表示点击数据所覆盖的天数,这个公式利用了熵的特性,如果p(i)的值越相似,则稳定性的值就越大,如果p(i)的值比较跌宕,稳定性的值就越小[47]。如图2-4所示:横坐标表示稳定性,纵坐标表示平均移动步长EL,每个观测的点代表了一个兴趣点,通过数据曲线拟合得到y=0.65exp(3.36x)。兴趣点的平均移动步长随稳定性的增加而呈现指数增长,即兴趣点的稳定性越大,其平均移动步长就越大,停留在该兴趣点中的时间也相应越长。图2-4稳定性和平均连续移动步长相关关系拟合函数图像2.2.3停驻时间分析停驻时间是衡量兴趣点的重要指标之一,实时分析停驻时间对研究人类在网络中兴趣行为来说具有重要意义。在点击流数据中,点击移动步长和真实停驻时间是不能完全割裂开来的,点击停驻时间可以用移动步长来衡量,值得深入探讨的是它和真实停驻时间有怎样的关系呢?文献[1]通过绘制真实停留时间和对应的平均点击驻留时间l的关系,比较得出l和t的平均正相关。为了进一步说明点击停驻时间和实际停留时间的等价性,实验
第2章在线用户兴趣行为量化分析14比较了两者的概率分布,如图2-5所示,把腾讯网站当作兴趣点,消除了步长l和时间t之间数量级之间的差异,研究点击停驻时间(红色表示)和实际停驻时间(蓝色表示)的相关性,可以发现人类兴趣动力学的幂律标度:在两端具有偏差,但在一般情况下,点击停驻时间的统计数据更加稳健,整体上点击停驻时间和实际停驻时间存在等价性。图2-5点击停驻时间和实际停驻时间对比分布图(a)baidu.com返回步长分布(b)qq.com返回步长分布图2-6返回步长分布特征2.2.4返回步长的幂律特征在真实生活空间中,人们的出行受到记忆效应和空间距离的影响,会选择近期去过的一些地方,对较短时间和较近距离能够到达的位置有更强烈的偏好[48]。记忆性作为人类自身的一种关键属性,在过去已经被广泛地进行了研究[1,4849]。在网络空间中用户是否也受到记忆效应的影响对近期访问过的兴趣表现出更强的
本文编号:2911577
【文章来源】:西北师范大学甘肃省
【文章页数】:58 页
【学位级别】:硕士
【部分图文】:
在线用户点击日志样例
西北师范大学硕士学位论文13入概念稳定性。定义5稳定性:是对一个网站连续移动步长变化的锐度的估计,由式(2-8)给出:1()()tnipipilog==(2-8)其中,n表示不同移动步长的个数,t表示点击数据所覆盖的天数,这个公式利用了熵的特性,如果p(i)的值越相似,则稳定性的值就越大,如果p(i)的值比较跌宕,稳定性的值就越小[47]。如图2-4所示:横坐标表示稳定性,纵坐标表示平均移动步长EL,每个观测的点代表了一个兴趣点,通过数据曲线拟合得到y=0.65exp(3.36x)。兴趣点的平均移动步长随稳定性的增加而呈现指数增长,即兴趣点的稳定性越大,其平均移动步长就越大,停留在该兴趣点中的时间也相应越长。图2-4稳定性和平均连续移动步长相关关系拟合函数图像2.2.3停驻时间分析停驻时间是衡量兴趣点的重要指标之一,实时分析停驻时间对研究人类在网络中兴趣行为来说具有重要意义。在点击流数据中,点击移动步长和真实停驻时间是不能完全割裂开来的,点击停驻时间可以用移动步长来衡量,值得深入探讨的是它和真实停驻时间有怎样的关系呢?文献[1]通过绘制真实停留时间和对应的平均点击驻留时间l的关系,比较得出l和t的平均正相关。为了进一步说明点击停驻时间和实际停留时间的等价性,实验
第2章在线用户兴趣行为量化分析14比较了两者的概率分布,如图2-5所示,把腾讯网站当作兴趣点,消除了步长l和时间t之间数量级之间的差异,研究点击停驻时间(红色表示)和实际停驻时间(蓝色表示)的相关性,可以发现人类兴趣动力学的幂律标度:在两端具有偏差,但在一般情况下,点击停驻时间的统计数据更加稳健,整体上点击停驻时间和实际停驻时间存在等价性。图2-5点击停驻时间和实际停驻时间对比分布图(a)baidu.com返回步长分布(b)qq.com返回步长分布图2-6返回步长分布特征2.2.4返回步长的幂律特征在真实生活空间中,人们的出行受到记忆效应和空间距离的影响,会选择近期去过的一些地方,对较短时间和较近距离能够到达的位置有更强烈的偏好[48]。记忆性作为人类自身的一种关键属性,在过去已经被广泛地进行了研究[1,4849]。在网络空间中用户是否也受到记忆效应的影响对近期访问过的兴趣表现出更强的
本文编号:2911577
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/2911577.html