当前位置:主页 > 社科论文 > 新闻传播论文 >

基于BTM主题模型的微博群体用户画像研究

发布时间:2021-11-28 11:54
  随着信息技术和互联网的不断发展,以微博、微信等为代表的社交媒体平台发展十分迅速,逐渐对人们的日常生活产生了巨大影响。人们在这些平台上自由地交流、表达个人情绪、分享个人意见的过程中产生了海量的信息数据,如何有效利用这些海量信息,创造出更有价值的用户服务是当今研究的热点。本论文在充分考虑微博数据特点的基础上,提出一种新颖的基于BTM(Biterm Topic Model)的微博群体用户画像模型GUPTM(Group User Profile Model based Topic Model),将用户的背景信息、社交信息、主题兴趣紧密联系在一起,从而构建出更为精准、全面、细致的社交平台微博群体的用户画像。同时,对群体用户画像在网络舆情治理方面的应用展开详细研究,最终为网络舆情治理提出新的治理对策。论文的主要研究内容如下:首先,提出一种新的基于BTM主题模型的微博群体用户聚类方法。从微博平台获取用户自由发布和分享的信息,建立模型数据集;对其进行用户关系分析和数据预处理,然后利用BTM主题模型挖掘用户的主题兴趣;分别计算用户背景信息相似度、用户社交信息相似度以及用户主题兴趣相似度,再将三种用户相似... 

【文章来源】:燕山大学河北省

【文章页数】:83 页

【学位级别】:硕士

【部分图文】:

基于BTM主题模型的微博群体用户画像研究


BTM生成模型

序列,文本,成词,概率


1)中文词汇按照 BEMS 四个状态来标记,即开始位置(begin),结束位置(end位置(middle),单独成词的位置(singgle)。2)通过模型训练得到的概率表,即获得一个概率最大的 BEMS 序列(以 B 打尾),进行句子的重新组合,最终得到分词结果。2.2 停用词过滤从所获得的微博用户数据中可以看到,新浪微博中存在着常见的一些信息式以及出现次数频繁的词或符号,如:“转发”、“#”、“//”、“@”等微博文本本身的话题相关性并不大,我们将其称为停用词。网络流行了多种具有各自特点的停用词表,主要包括“百度停用词列表”、“哈工大停用词表”、大学机器学习智能实验室停用词库”等。我们对这些主流的停用词表进行去并加以总结,综合生成一个新的停用词表。该停用词表共包含 1893 个停用词完整的针对微博文本,具体如图 3-2 所示。

聚类,主题,舆情,文档


第 5 章 微博群体用户画像模型在网络舆情中的应用用户综合相似度。然后利用 BTM 主题模型得到的文档-主题矩阵,将率最大的文档所对应的微博用户,作为 K-means 聚类的初始中心。最ans 聚类算法进行用户分群,实验设定的聚类数 k 分别取 5 和 10,两次图 5-4、5-5 所示:

【参考文献】:
期刊论文
[1]基于用户画像的图书馆大数据知识服务情境化推荐[J]. 刘海鸥,姚苏梅,黄文娜,张亚明.  图书馆学研究. 2018(24)
[2]面向情境化推荐服务的图书馆用户画像研究[J]. 刘海鸥,黄文娜,谢姝琳.  图书馆学研究. 2018(20)
[3]基于云模型理论的群体用户画像模型[J]. 姚龙飞,何利力.  计算机系统应用. 2018(06)
[4]一种用户画像系统的设计与实现[J]. 王洋,丁志刚,郑树泉,齐文秀.  计算机应用与软件. 2018(03)
[5]一种用于构建用户画像的多视角融合框架[J]. 费鹏,林鸿飞,杨亮,徐博,古丽孜热·艾尼外.  计算机科学. 2018(01)
[6]基于用户画像的图书馆知识发现服务研究[J]. 张钧.  图书与情报. 2017(06)
[7]一种集成用户画像与内容的服务重定向方法[J]. 熊伟,杭波,李兵,吴钊,谷琼.  小型微型计算机系统. 2017(12)
[8]基于社会认同理论的微博群体用户画像[J]. 林燕霞,谢湘生.  情报理论与实践. 2018(03)
[9]基于动态主题模型融合多维数据的微博社区发现算法[J]. 刘冰玉,王翠荣,王聪,王军伟,王兴伟,黄敏.  软件学报. 2017(02)
[10]UGC网站用户画像研究[J]. 陈志明,胡震云.  计算机系统应用. 2017(01)

硕士论文
[1]基于多模态社交媒体数据源的用户画像构建的研究[D]. 黄秀.电子科技大学 2018
[2]基于主题模型的社交网络用户画像分析方法[D]. 马超.中国科学技术大学 2017
[3]基于主题模型的用户画像提取算法研究[D]. 王丹.北京工业大学 2016
[4]大数据背景下用户画像的统计方法实践研究[D]. 李映坤.首都经济贸易大学 2016



本文编号:3524378

资料下载
论文发表

本文链接:https://www.wllwen.com/xinwenchuanbolunwen/3524378.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3029e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com