融合网络结构和文本内容的群体画像构建方法研究
发布时间:2021-11-20 06:39
信息网络的迅速发展,使得用户数据日渐增多,基于网络数据进行用户画像构建研究,对精准推荐等个性化服务研究领域具有重要意义。针对现有群体画像构建方法多基于用户在网络上发表的文本内容,较少考虑网络结构信息所造成的用户建模精度低、网络群体相似性和紧密性差的问题,提出了一种融合网络结构和文本内容的群体画像构建方法。首先,采用LINE模型的一阶邻近度和二阶邻近度建模局部和全局网络结构,通过目标函数优化合并局部和全局结构建模向量;借助注意力机制,在神经网络的隐藏层引入注意力矩阵对文本内容的上下文进行表示,进而实现文本内容建模;融合两种模型并采用卷积神经网络方法训练,将网络用户表示为空间向量。其次,采用密度峰值聚类算法对用户空间向量聚类,通过计算每个用户的局部密度和距离,确定用户类别标签,并利用结构-内容模块度对聚类结果迭代优化,实现网络群体构建。最后,采用LDA主题建模法进行主题划分,得到每个群体的关注话题标签,并利用可视化工具刻画群体画像。采用知乎、Cora和Hep Th三种数据集,进行建模精度和群体构建效果对比实验。本文方法同Deep Walk、LINE、Node2vec、SDNE、TADW六种...
【文章来源】:辽宁工程技术大学辽宁省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
群体画像构建总体流程
?囟砸丫?裳?慕诘阒馗捶梦剩?钡铰?闵瓒?的序列长度阈值。根据采样情况,会得到一个概率公式,通过词向量中的skip-gram模型对概率公式进行优化,最终得到所需的节点向量表示。1)随机游走随机游走是指,从网络中的一个节点出发,随机选择与当前节点相连的下一个节点游走,不断重复这个过程,直到满足终止条件为止,最终生成一条连贯的网络路径。例如,图2.2中的红色路径,即为一条随机游走路径。随机游走只能对局部网络结构建模,对于含有成千上万节点的大型网络来说,可以多节点并行随机游走,以提高游走采样的效率。图2.2DeepWalk随机游走路径Figure2.2RandomwalkpathofDeepWalk2)skip-gram模型对于随机游走产生的概率公式,采用skip-gram模型进行优化。由于网络嵌入思想源于文本嵌入,且具有相似特性,因此,在DeepWalk中通过引用词向量模型,得到skip-gram优化模型。所谓的词向量模型,就是对于一个单词序列),...,,(10niuwwww,当知道单词序
一阶邻近度和二阶邻近度Figure2.3First-orderproximityandsecond-orderproximity
【参考文献】:
期刊论文
[1]基于网络结构和文本内容的群体画像构建方法研究[J]. 邱云飞,张伟竹. 图书情报工作. 2019(22)
[2]基于用户画像的数字图书馆精准推荐服务体系构建研究[J]. 张晗,毕强,李洁,丁梦晓. 情报理论与实践. 2019(11)
[3]基于大数据的用户画像构建方法与运用[J]. 谭浩,郭雅婷. 包装工程. 2019(22)
[4]Inferring user profiles in social media by joint modeling of text and networks[J]. Ruifeng XU,Jiachen DU,Zhishan ZHAO,Yulan HE,Qinghong GAO,Lin GUI. Science China(Information Sciences). 2019(11)
[5]考虑全局和局部信息的科研人员科研行为立体精准画像构建方法[J]. 张亚楠,黄晶丽,王刚. 情报学报. 2019(10)
[6]融合用户智能标签与社会化标签的推荐服务[J]. 贾伟,刘旭艳,徐彤阳. 情报科学. 2019(10)
[7]基于舆情画像的在线社交用户信息传播特征统计分析[J]. 刘海鸥,刘旭,姚苏梅,谢姝琳. 现代情报. 2019(09)
[8]学术用户画像的行为与兴趣标签构建与应用[J]. 王仁武,张文慧. 现代情报. 2019(09)
[9]社交媒体用户画像的构建及资源聚合模型研究[J]. 徐海玲,张海涛,魏明珠,尹慧子. 图书情报工作. 2019(09)
[10]国内外图书情报领域用户画像研究现状及展望[J]. 张海涛,徐海玲,张枭慧,武慧娟. 图书情报工作. 2019(07)
博士论文
[1]基于社交大数据的用户信用画像方法研究[D]. 郭光明.中国科学技术大学 2017
硕士论文
[1]基于动态主题模型的微博用户分类画像应用研究[D]. 任金玥.华东师范大学 2019
[2]属性推理在用户画像系统的应用研究[D]. 宋光晨.陕西师范大学 2019
[3]在线社交网络中用户画像构建及其应用研究[D]. 汪强兵.南京理工大学 2018
[4]融入社交网络信息的DIT用户偏好预测模型[D]. 张长红.浙江工商大学 2018
[5]基于文本挖掘的社交网络用户画像建模与应用[D]. 徐英楠.北京邮电大学 2016
本文编号:3506775
【文章来源】:辽宁工程技术大学辽宁省
【文章页数】:71 页
【学位级别】:硕士
【部分图文】:
群体画像构建总体流程
?囟砸丫?裳?慕诘阒馗捶梦剩?钡铰?闵瓒?的序列长度阈值。根据采样情况,会得到一个概率公式,通过词向量中的skip-gram模型对概率公式进行优化,最终得到所需的节点向量表示。1)随机游走随机游走是指,从网络中的一个节点出发,随机选择与当前节点相连的下一个节点游走,不断重复这个过程,直到满足终止条件为止,最终生成一条连贯的网络路径。例如,图2.2中的红色路径,即为一条随机游走路径。随机游走只能对局部网络结构建模,对于含有成千上万节点的大型网络来说,可以多节点并行随机游走,以提高游走采样的效率。图2.2DeepWalk随机游走路径Figure2.2RandomwalkpathofDeepWalk2)skip-gram模型对于随机游走产生的概率公式,采用skip-gram模型进行优化。由于网络嵌入思想源于文本嵌入,且具有相似特性,因此,在DeepWalk中通过引用词向量模型,得到skip-gram优化模型。所谓的词向量模型,就是对于一个单词序列),...,,(10niuwwww,当知道单词序
一阶邻近度和二阶邻近度Figure2.3First-orderproximityandsecond-orderproximity
【参考文献】:
期刊论文
[1]基于网络结构和文本内容的群体画像构建方法研究[J]. 邱云飞,张伟竹. 图书情报工作. 2019(22)
[2]基于用户画像的数字图书馆精准推荐服务体系构建研究[J]. 张晗,毕强,李洁,丁梦晓. 情报理论与实践. 2019(11)
[3]基于大数据的用户画像构建方法与运用[J]. 谭浩,郭雅婷. 包装工程. 2019(22)
[4]Inferring user profiles in social media by joint modeling of text and networks[J]. Ruifeng XU,Jiachen DU,Zhishan ZHAO,Yulan HE,Qinghong GAO,Lin GUI. Science China(Information Sciences). 2019(11)
[5]考虑全局和局部信息的科研人员科研行为立体精准画像构建方法[J]. 张亚楠,黄晶丽,王刚. 情报学报. 2019(10)
[6]融合用户智能标签与社会化标签的推荐服务[J]. 贾伟,刘旭艳,徐彤阳. 情报科学. 2019(10)
[7]基于舆情画像的在线社交用户信息传播特征统计分析[J]. 刘海鸥,刘旭,姚苏梅,谢姝琳. 现代情报. 2019(09)
[8]学术用户画像的行为与兴趣标签构建与应用[J]. 王仁武,张文慧. 现代情报. 2019(09)
[9]社交媒体用户画像的构建及资源聚合模型研究[J]. 徐海玲,张海涛,魏明珠,尹慧子. 图书情报工作. 2019(09)
[10]国内外图书情报领域用户画像研究现状及展望[J]. 张海涛,徐海玲,张枭慧,武慧娟. 图书情报工作. 2019(07)
博士论文
[1]基于社交大数据的用户信用画像方法研究[D]. 郭光明.中国科学技术大学 2017
硕士论文
[1]基于动态主题模型的微博用户分类画像应用研究[D]. 任金玥.华东师范大学 2019
[2]属性推理在用户画像系统的应用研究[D]. 宋光晨.陕西师范大学 2019
[3]在线社交网络中用户画像构建及其应用研究[D]. 汪强兵.南京理工大学 2018
[4]融入社交网络信息的DIT用户偏好预测模型[D]. 张长红.浙江工商大学 2018
[5]基于文本挖掘的社交网络用户画像建模与应用[D]. 徐英楠.北京邮电大学 2016
本文编号:3506775
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3506775.html
最近更新
教材专著