基于活动轨迹嵌入的用户行为分析
发布时间:2021-11-16 11:00
由于智能设备和无线通信技术的普及,产生了大量描述物体运动历史的时空轨迹。其中,活动轨迹通过关联活动信息与时空轨迹来丰富传统的轨迹数据。这些轨迹数据包含有大量的用户活动信息,能够加深我们对人类行为的理解。然而现有的时空轨迹研究,忽略了丰富的用户活动信息,缺少对用户行为的个性化分析。因此,在本文中,我们利用活动轨迹的时间和活动属性来建模用户活动,分析用户行为相似性以及预测用户行为状态。总体来讲,本文的主要贡献如下:(1)在用户行为相似度任务中,以往工作主要采用活动地点的时间和空间信息,忽略了和用户行为关联最紧密的活动信息。因此,本文提出了基于活动轨迹嵌入的用户行为相似度算法,该算法首先利用高斯混合模型拟合活动时间分布并将时间进行分段,然后根据滑动窗口扫描用户活动轨迹获取用户和轨迹特征,最终基于散列的相似度计算方法来比较用户之间的行为相似度。大量的实验验证了我们提出方法的性能和效率。(2)在用户行为预测任务中,已有工作主要通过用户历史活动记录以及社交关系来进行预测,缺乏对用户行为偏好的挖掘。因此,本文提出了基于活动轨迹嵌入的用户行为预测算法,该算法首先通过段向量模型提取用户行为偏好特征,然后...
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图1-1用户行为研究整体框架??
基于活动轨迹嵌入的用户行为分析?第二章相关概念及方法??高斯混合模型由多个高斯分布组合而成,理论上它可以模拟任意类型的分布。高斯??分布也被叫做正态分布,是一种最常见的分布形式。通常一个班级学生的身高,考??试成绩大多符合高斯分布。高斯混合模型是对高斯分布进行简单的拓展,通过多个??高斯分布的线性组合来表达更复杂的数据分布特征。??高斯混合模型的概率分布形式可以表示为如下公式,??K??P(y\e)?=?Yj?aM〇k)?(2.D??k=\??其中,叫是混合系数,并且需要满足叫>〇和的=丨。0(J防)是混合模型的第々??个分模型,代表一个正态分布。它是高斯分布密度函数,民=(凡,d),公式如下表??示。??參士於聲>?(2.2)??举一个简单的例子,如图2-1所示,蓝色线段表示女生身高分布,绿色线段表示男生??身高分布,由于男生和女生之间身高分布存在一定差异,所以当表示整个班级学生??身高分布时无法使用-个单一的高斯分布来拟合,因此可以使用男生和女生身高分??布的线性组合表示。??1.3?1.4?1.5?1.6?1.7?1.8?1.9?2.0??图2-1学生身高分布??高斯混合模型常被用于聚类应用,GMM中的K个分模型相当于K个类别,因此??可以使用数据来估算概率密度。当在GMM中随机选取一个点,这个点属于每个子模??11??
络结构,包括输入层、隐藏层和输出层。它根据单词词频使用Huffman来编码,??使得所有词频相似的词语隐藏层激活的内容相似,出现频率越高的词语,它们激??活的隐藏层数目越少,这样可以有效降低模型复杂度。Word2VeC模型的高效性深??受大众喜爱。Word2vec模型使用了两种建模方法,ContinousBagofWords?(CBOW)??和Skip-gram。CBOW的目标是根据上下文来预测当前词语的概率,而Skip-gram则刚??好相反,它根据当前词语来预测上下文的概率(模型如图2-2所示)。两种方法的预??测任务通常使用一个多分类器,例如Softmax函数。Word2vec模型训练出的单词表征??可以一定程度上发现词之间的语义关系(比如,“国王”“男人”?+?“女人”王??后”)。W〇rd2vec模型对词向量进行了平均化处理,它忽略了单词间排序的影响,也??就是说它只是基于词的维度进行语义分析,而不具有上下文的语义分析能力。??Input?Projection?Output?Input?Projection?Output??W(t-2)?W(t-2)??w(t-i)?_1}?????W(t)?W(t)?????W(t+1)?,?y/?SUM?W(t+1)??W(t+2)?<?"?W(t+2)??CBOW?Skip-gram??图2-2词向量模型结构框架??13??
【参考文献】:
期刊论文
[1]基于位置轨迹数据的用户相似性分析[J]. 贾若然,刘曙光,孙启龙. 计算机与数字工程. 2016(08)
[2]基于LCS的用户时空行为兴趣相似性计算方法[J]. 李晓静,张晓滨. 计算机工程与应用. 2013(20)
[3]基于位置的社交网络用户轨迹相似性算法[J]. 张莹,李智,张省. 四川大学学报(工程科学版). 2013(S2)
[4]基于路网的LBSN用户移动轨迹聚类挖掘方法[J]. 邹永贵,万建斌,夏英. 计算机应用研究. 2013(08)
本文编号:3498755
【文章来源】:苏州大学江苏省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
图1-1用户行为研究整体框架??
基于活动轨迹嵌入的用户行为分析?第二章相关概念及方法??高斯混合模型由多个高斯分布组合而成,理论上它可以模拟任意类型的分布。高斯??分布也被叫做正态分布,是一种最常见的分布形式。通常一个班级学生的身高,考??试成绩大多符合高斯分布。高斯混合模型是对高斯分布进行简单的拓展,通过多个??高斯分布的线性组合来表达更复杂的数据分布特征。??高斯混合模型的概率分布形式可以表示为如下公式,??K??P(y\e)?=?Yj?aM〇k)?(2.D??k=\??其中,叫是混合系数,并且需要满足叫>〇和的=丨。0(J防)是混合模型的第々??个分模型,代表一个正态分布。它是高斯分布密度函数,民=(凡,d),公式如下表??示。??參士於聲>?(2.2)??举一个简单的例子,如图2-1所示,蓝色线段表示女生身高分布,绿色线段表示男生??身高分布,由于男生和女生之间身高分布存在一定差异,所以当表示整个班级学生??身高分布时无法使用-个单一的高斯分布来拟合,因此可以使用男生和女生身高分??布的线性组合表示。??1.3?1.4?1.5?1.6?1.7?1.8?1.9?2.0??图2-1学生身高分布??高斯混合模型常被用于聚类应用,GMM中的K个分模型相当于K个类别,因此??可以使用数据来估算概率密度。当在GMM中随机选取一个点,这个点属于每个子模??11??
络结构,包括输入层、隐藏层和输出层。它根据单词词频使用Huffman来编码,??使得所有词频相似的词语隐藏层激活的内容相似,出现频率越高的词语,它们激??活的隐藏层数目越少,这样可以有效降低模型复杂度。Word2VeC模型的高效性深??受大众喜爱。Word2vec模型使用了两种建模方法,ContinousBagofWords?(CBOW)??和Skip-gram。CBOW的目标是根据上下文来预测当前词语的概率,而Skip-gram则刚??好相反,它根据当前词语来预测上下文的概率(模型如图2-2所示)。两种方法的预??测任务通常使用一个多分类器,例如Softmax函数。Word2vec模型训练出的单词表征??可以一定程度上发现词之间的语义关系(比如,“国王”“男人”?+?“女人”王??后”)。W〇rd2vec模型对词向量进行了平均化处理,它忽略了单词间排序的影响,也??就是说它只是基于词的维度进行语义分析,而不具有上下文的语义分析能力。??Input?Projection?Output?Input?Projection?Output??W(t-2)?W(t-2)??w(t-i)?_1}?????W(t)?W(t)?????W(t+1)?,?y/?SUM?W(t+1)??W(t+2)?<?"?W(t+2)??CBOW?Skip-gram??图2-2词向量模型结构框架??13??
【参考文献】:
期刊论文
[1]基于位置轨迹数据的用户相似性分析[J]. 贾若然,刘曙光,孙启龙. 计算机与数字工程. 2016(08)
[2]基于LCS的用户时空行为兴趣相似性计算方法[J]. 李晓静,张晓滨. 计算机工程与应用. 2013(20)
[3]基于位置的社交网络用户轨迹相似性算法[J]. 张莹,李智,张省. 四川大学学报(工程科学版). 2013(S2)
[4]基于路网的LBSN用户移动轨迹聚类挖掘方法[J]. 邹永贵,万建斌,夏英. 计算机应用研究. 2013(08)
本文编号:3498755
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3498755.html