基于本体的微博话题发现与倾向性分析研究
发布时间:2021-07-26 00:26
微博简短写作,便捷发布,实时交互的特点吸引了越来越多的人在微博上实时更新消息,交流观点,微博平台的规模迅速发展起来,其提供的功能服务越来越丰富。庞大的微博信息看似杂乱无章,没有规则,实则包含了众多话题,从海量的微博信息中找出热点话题,并对其进行情感分析逐渐成为一个新的微博应用领域。本文针对中文微博做话题发现与倾向性分析研究。首先分析国内外微博话题发现和倾向性分析方面的最新研究方法和成果,设计出一个微博话题发现算法;然后,依据情感词本体、规则集和微博表情符号,对发现出来的话题进行情感分析,从而获得指定话题的情感倾向。最后,以2013年1月15日到2013年2月5日20天内的新浪微博数据为基础,初步实现了一个微博话题情感分析原型系统。本文的主要工作如下:(1)情感词汇本体构建:研究了情感词获取方法,一方面整理和总结了当前已有情感词汇资源,构建基础情感词本体,另一方面搜集网络情感用语和一些兼类词扩充基础情感词本体。(2)微博话题发现:首先对具有相同主题的原创微博、转发微博、评论微博进行合并,生成单微博树,形成一个长文本,以3-Gram模型表示该长文本;然后对具有高相似度的多个单微博树进行合并...
【文章来源】:河南师范大学河南省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
012年度微博热门话题
微博应用最广泛的标签符号有 3 类,分别为:向某人说”或者“需要引起某人的注意”。相当于超微博。转发某条微博时,系统会自动在转发内容前来的文字,可以理解为“话题”,也可以理解为某条该关键字的内容相互关联起来,点击后将跳转到包,可以利用该功能抽取包含特定话题的所有微博消息博系统自动添加的,出现在再一次转发已转发并带有一微博的多人多次评论的作用。某种程度上,通过观条微博的讨论热烈程度。一条微博消息中通常存在若干表情符号,这些表情符择。很多微博用户喜欢使用表情符号来表达心情,析中起着重要作用。新浪微博平台提供的表情符号如
图2-3“骨架”方法本体开发流程图icheal Gruninger & Mark.S Fox 的企业建模法(TOVE)E 是加拿大的多伦多大学 Enterprise Integration Laboratory 的一个项目一套为商业和公共企业建模的集成本体,并且已经建成了相关本体。业设计本体、工程本体、计划本体和服务本体。其本体构建的过程如情景材料阶段;(B)非形式化本体能力问题的形成阶段;(C)术语的抽形式化;(E)关于本体词汇公理的定义。其流程如图 2-4 所示。 图2-4 TOVE本体开发流程图ariano Fernandez & GOMEZ-PEREZ 的“Meth 本体”方法
【参考文献】:
期刊论文
[1]基于隐主题分析和文本聚类的微博客中新闻话题的发现[J]. 路荣,项亮,刘明荣,杨青. 模式识别与人工智能. 2012(03)
[2]基于情感词汇本体的主观性句子倾向性计算[J]. 王晓东,王娟,张征. 计算机应用. 2012(06)
[3]情感Ontology构建与文本倾向性分析[J]. 王晓东,刘倩,陶县俊. 计算机工程与应用. 2010(30)
[4]商空间模型下的Ontology形式化及其检验[J]. 王晓东,孙滨. 计算机工程与应用. 2010(25)
[5]面向网络论坛的突发话题发现[J]. 陈友,程学旗,杨森. 中文信息学报. 2010(03)
[6]网络舆情热点信息自动发现方法[J]. 郑魁,疏学明,袁宏永. 计算机工程. 2010(03)
[7]面向互联网评论情感分析的中文主观性自动判别方法研究[J]. 叶强,张紫琼,罗振雄. 信息系统学报. 2007(01)
[8]基于语义理解的文本倾向性识别机制[J]. 徐琳宏,林鸿飞,杨志豪. 中文信息学报. 2007(01)
[9]Ontology方法学综述[J]. 杨秋芬,陈跃新. 计算机应用研究. 2002(04)
硕士论文
[1]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
本文编号:3303071
【文章来源】:河南师范大学河南省
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
012年度微博热门话题
微博应用最广泛的标签符号有 3 类,分别为:向某人说”或者“需要引起某人的注意”。相当于超微博。转发某条微博时,系统会自动在转发内容前来的文字,可以理解为“话题”,也可以理解为某条该关键字的内容相互关联起来,点击后将跳转到包,可以利用该功能抽取包含特定话题的所有微博消息博系统自动添加的,出现在再一次转发已转发并带有一微博的多人多次评论的作用。某种程度上,通过观条微博的讨论热烈程度。一条微博消息中通常存在若干表情符号,这些表情符择。很多微博用户喜欢使用表情符号来表达心情,析中起着重要作用。新浪微博平台提供的表情符号如
图2-3“骨架”方法本体开发流程图icheal Gruninger & Mark.S Fox 的企业建模法(TOVE)E 是加拿大的多伦多大学 Enterprise Integration Laboratory 的一个项目一套为商业和公共企业建模的集成本体,并且已经建成了相关本体。业设计本体、工程本体、计划本体和服务本体。其本体构建的过程如情景材料阶段;(B)非形式化本体能力问题的形成阶段;(C)术语的抽形式化;(E)关于本体词汇公理的定义。其流程如图 2-4 所示。 图2-4 TOVE本体开发流程图ariano Fernandez & GOMEZ-PEREZ 的“Meth 本体”方法
【参考文献】:
期刊论文
[1]基于隐主题分析和文本聚类的微博客中新闻话题的发现[J]. 路荣,项亮,刘明荣,杨青. 模式识别与人工智能. 2012(03)
[2]基于情感词汇本体的主观性句子倾向性计算[J]. 王晓东,王娟,张征. 计算机应用. 2012(06)
[3]情感Ontology构建与文本倾向性分析[J]. 王晓东,刘倩,陶县俊. 计算机工程与应用. 2010(30)
[4]商空间模型下的Ontology形式化及其检验[J]. 王晓东,孙滨. 计算机工程与应用. 2010(25)
[5]面向网络论坛的突发话题发现[J]. 陈友,程学旗,杨森. 中文信息学报. 2010(03)
[6]网络舆情热点信息自动发现方法[J]. 郑魁,疏学明,袁宏永. 计算机工程. 2010(03)
[7]面向互联网评论情感分析的中文主观性自动判别方法研究[J]. 叶强,张紫琼,罗振雄. 信息系统学报. 2007(01)
[8]基于语义理解的文本倾向性识别机制[J]. 徐琳宏,林鸿飞,杨志豪. 中文信息学报. 2007(01)
[9]Ontology方法学综述[J]. 杨秋芬,陈跃新. 计算机应用研究. 2002(04)
硕士论文
[1]微博客热点话题发现策略研究[D]. 杨冠超.浙江大学 2011
本文编号:3303071
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3303071.html