当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的社交媒体文本分析方法研究

发布时间:2024-07-05 22:45
  随着Web2.0技术的快速发展以及在线交互式应用的迅速普及,社交媒体已经逐渐取代传统媒体,成为人们获取信息和交流信息最重要媒介,以新浪微博、微信为代表的社交媒体开始逐渐成为人们生活中不可或缺的部分。社交媒体的出现为人们的社交生活带来了翻天覆地的改变,社交媒体在满足人们社交需求的同时,为人们提供了获取信息、分享信息的平台,满足了人们的信息需求。社交媒体中包含了海量的社交文本数据,具有丰富的应用场景。社交媒体作为新兴媒体,呈现出以下三个典型特征。第一,意见领袖掌握着社交媒体中的话语权。第二,社交媒体中的话题具有突发性和不可靠性。第三,社交媒体具有信息过载的特点。本文针对社交媒体自身的特点和所面临的问题,结合现有研究工作中存在的不足,深入研究了社交媒体中文本相关的三个关键问题:(1)话题相关的用户影响力分析;(2)突发话题检测;(3)针对微博话题分类的时间稳定性学习。取得的创新性成果如下:(1)针对话题相关的用户影响力分析问题,本文提出用户话题时间影响力模型框架和在线的用户话题时间影响力模型。首先,本文提出发现话题相关的当下影响力用户的问题。为此,提出用户话题时间影响力模型,该模型对社交媒体...

【文章页数】:124 页

【学位级别】:博士

【部分图文】:

图2-1隐含狄利克雷分布模型的图模型表示??

图2-1隐含狄利克雷分布模型的图模型表示??

隐含狄利克雷分布模型是一种混合模型,也就是一系列模型的凸组合。凸组??合是指所有模型的加权等于一的模型组合。隐含狄利克雷分布模型是贝叶斯网络??的一种,其图表示如图2-1所示。隐含狄利克雷分布模型生成一系列可观测的单??e?表示第m个文档中的单词向量。每个文档都有一个在话题上的?....


图3-1用户A和用户B粉丝数随时间的变化??

图3-1用户A和用户B粉丝数随时间的变化??

?指数衰减参数,线性衰减参数??3.2.1用户话题影响力的研究问题阐述??图3-1展示了用户A和用户B的粉丝数量随时间的变化。可以观察到,用??户A得到的关注越来越多,而用户B得到的关注却越来越少。尽管他们最终拥??有相同的粉丝数量,但随着时间的变化,用户A比用户B越来越受欢迎。....


图3-2新浪微博中易建联和林书豪粉丝数随时间的变化(2015.11.18?2015.12.01)??

图3-2新浪微博中易建联和林书豪粉丝数随时间的变化(2015.11.18?2015.12.01)??

?指数衰减参数,线性衰减参数??3.2.1用户话题影响力的研究问题阐述??图3-1展示了用户A和用户B的粉丝数量随时间的变化。可以观察到,用??户A得到的关注越来越多,而用户B得到的关注却越来越少。尽管他们最终拥??有相同的粉丝数量,但随着时间的变化,用户A比用户B越来越受欢迎。....


图3-4基于人工判断的不同方法在所有话题上的平均得分(误差棒为标准误差)??

图3-4基于人工判断的不同方法在所有话题上的平均得分(误差棒为标准误差)??

判断的标准就是用户在相应话题上受欢迎的程度,尤其是在最近的时间而不是早??期。学生还可以使用所提供的每个用户的粉丝数和粉丝变化趋势线作为参考。最??后,使用每个用户得分的平均分作为他们的最终的影响力评分。图3-4展示了不??同方法在t〇p-/t影响力用户发现的通过人工判断的平均得....



本文编号:4001659

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/4001659.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户796cd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com