社会化媒体用户隐含属性识别技术研究
发布时间:2020-12-14 21:35
现今,社会化媒体的普及,积累了规模庞大且具有价值的用户数据资源。海量的异构数据给学术界在大数据挖掘领域带来了新的突破点,社会化媒体用户隐含属性识别任务也应运而生。社会化媒体用户隐含属性识别是指运用现有的规模数据自动推断出社会化媒体用户群体的未知属性与潜在特质。基于微博、知乎不同的用户数据,本文有针对性地提出了以下两种方法:1.基于Labeled LDA模型的社会化媒体用户隐含属性识别方法本文运用Labeled LDA模型识别知乎社区这一社会化媒体的用户的隐含属性——职业倾向。与微博用户文本数据相比较,知乎社区用户文本多为成千上万的长文本数据且规模庞大,需进行复杂的数据清洗才能投入实验。本文尝试利用用户的行为特征——粉丝用户对“意见领袖”用户的关注行为进行隐含属性——职业倾向的识别。因用户的各个行业存在规范文本,本文可直接利用现有的规范文本作为标签,运用Labeled LDA模型进行识别任务。利用用户的行为特征进行隐含属性职业倾向识别。该识别系统的准确度比利用文本统计特征的方法高5个百分点。2.基于递归神经网络的社会化媒体用户隐含属性识别方法该方法基于递归神经网络,融合多种特征进行社会化...
【文章来源】:西北师范大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
演员刘昊然微博部分信息图2-1展示出微博用户刘昊然的昵称、图像与个人简介等信息
已经成为新媒体的发展方式。现有的微博、百度问答等内个开放性且具有问答属性的网络社区,知乎用户们围绕着关的探讨与交流,知乎用户具有专业性、精英化的属性。一个能获取真实有效的专业性知识的平台,在这内容为王了用户的专业性需求。用户使用知乎的“赞同”“反对”高低,筛选出高质量内容。在知乎成立之前,国外的 Quo推荐机制。分三类,一类热衷于生产内容,一类喜欢阅读高质量内容的结合体。乎用户所在行业户为了让自己的答案和文章能获得认可与推荐,多数会填括但不限于所在行业、职业经历、教育经历、个人简介等
本文编号:2917050
【文章来源】:西北师范大学甘肃省
【文章页数】:52 页
【学位级别】:硕士
【部分图文】:
演员刘昊然微博部分信息图2-1展示出微博用户刘昊然的昵称、图像与个人简介等信息
已经成为新媒体的发展方式。现有的微博、百度问答等内个开放性且具有问答属性的网络社区,知乎用户们围绕着关的探讨与交流,知乎用户具有专业性、精英化的属性。一个能获取真实有效的专业性知识的平台,在这内容为王了用户的专业性需求。用户使用知乎的“赞同”“反对”高低,筛选出高质量内容。在知乎成立之前,国外的 Quo推荐机制。分三类,一类热衷于生产内容,一类喜欢阅读高质量内容的结合体。乎用户所在行业户为了让自己的答案和文章能获得认可与推荐,多数会填括但不限于所在行业、职业经历、教育经历、个人简介等
本文编号:2917050
本文链接:https://www.wllwen.com/xinwenchuanbolunwen/2917050.html