面向社会媒体的文本和属性分析技术研究
发布时间:2021-09-28 08:39
近年来,随着社会媒体网站的兴起,越来越多的用户参与到其中。社会媒体已经成为用户日常生活中必不可少的一部分。在目前以互联网为导向的大环境中,对社会媒体中与用户相关的内容进行深入理解和挖掘是一个非常重要的研究方向,具有重要的学术价值和应用价值。社会媒体除了丰富人们的生活,也为研究用户的文本内容和属性带来了机遇与挑战。首先,用户所写的文本内容丰富多样;其次,用户的属性信息也复杂多变,这些都为相关研究带来了很大的挑战。本研究的主要内容是面向社会媒体中与用户相关的文本内容和属性的分析技术。针对文本内容和属性,本研究分别设计了相应的模型对数据进行建模,以期更好地理解社会媒体中的用户。本研究的主要内容和创新点总结如下:(1)建模文本内容,提出一种自动挖掘辩论文本中的组织短语的无监督模型。当用户与其他人辩论的时候,除了会使用与辩论主题相关的声明和证据外,还会使用将证据和声明联系起来的组织短语(简称为shell)。本研究探讨如何通过无监督的方法区分shell与主题内容。基于此,本研究提出了一种隐变量模型——shell主题模型(简称为STM)来同时建模主题和shell。对于组织短语,本研究使用二元模型对其...
【文章来源】:北京理工大学北京市 211工程院校 985工程院校
【文章页数】:120 页
【学位级别】:博士
【部分图文】:
PLSA模型的图模型表示PLSA模型假设每个文档有多个主题ˋ并且这些主题在文档中所占比例不同在
LDA的图模型表示
看法ˋ来揭露对方所述观点的矛盾ˋ以便得到共同的认知和意见 除了日常生活中的口头辩论ˋ书面辩论也是一种重要的辩论方式 辩论文本就是一种用于说服对方的文本 传统的辩论文本包括议论短文 法律文件和议会辩论实录等 作为社会媒体的一种表现形式ˋ在线讨论论坛和辩论论坛也越来越流行ˋ辩论论坛为用户提供了针对实事或者热点的虚拟辩论平台 图 2.1 展示了辩论论坛的一个实例
【参考文献】:
期刊论文
[1]微博中基于多关系网络的话题影响力个体挖掘(英文)[J]. 丁兆云,贾焰,周斌,韩毅. 中国通信. 2013(01)
本文编号:3411586
【文章来源】:北京理工大学北京市 211工程院校 985工程院校
【文章页数】:120 页
【学位级别】:博士
【部分图文】:
PLSA模型的图模型表示PLSA模型假设每个文档有多个主题ˋ并且这些主题在文档中所占比例不同在
LDA的图模型表示
看法ˋ来揭露对方所述观点的矛盾ˋ以便得到共同的认知和意见 除了日常生活中的口头辩论ˋ书面辩论也是一种重要的辩论方式 辩论文本就是一种用于说服对方的文本 传统的辩论文本包括议论短文 法律文件和议会辩论实录等 作为社会媒体的一种表现形式ˋ在线讨论论坛和辩论论坛也越来越流行ˋ辩论论坛为用户提供了针对实事或者热点的虚拟辩论平台 图 2.1 展示了辩论论坛的一个实例
【参考文献】:
期刊论文
[1]微博中基于多关系网络的话题影响力个体挖掘(英文)[J]. 丁兆云,贾焰,周斌,韩毅. 中国通信. 2013(01)
本文编号:3411586
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/3411586.html