面向微博热门话题的主客观分类方法研究
发布时间:2021-08-15 23:37
随着Web2.0的快速发展,互联网的载体已经不仅仅是单一的电脑,手机、平板电脑等移动终端已经悄然进入了人们的视野。人们获取、分享信息也不单单通过社区、博客,而是能够随时随地发表微博,实现即时分享。微博用户的大幅度增长吸引了一大批学者对其发表言论进行研究,面向微博热门话题的主客观分类问题是其中的重要课题之一。到目前为止,国内外学者主要针对无话题的微博文本进行研究,而面向热门话题的微博文本研究尚处于起步阶段。热门话题下的微博言论文本具有话题分散性,即用户发表的言论常常与当前的热门话题不相关,这个现象会导致针对微博热门话题的主客观分类方法准确率不高。基于此,本文将面向微博热门话题的主客观分类问题看成是两个子问题——话题相关性分类子问题和主客观分类子问题,对两个子问题独立建模,再使用Logistic回归对两个结果集建模,得出当前热门话题下的主观性观点表达。本文的主要研究内容如下:(1)研究了基于同义词词林的话题相关度计算方法。在话题相关性分类子问题中,主要研究当前微博语料是否与所关注的热门话题相关,如何度量两者之间的相关程度是此问题的关键之处。本文以同义词词林扩展版作为资源,通过计算当前词与热...
【文章来源】:山西大学山西省
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Contents
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 论文组织结构
第二章 问题描述及相关资源
2.1 面向微博热门话题的主客观分类问题描述
2.1.1 话题相关性分类子问题描述
2.1.2 主客观分类子问题描述
2.2 相关资源
2.2.1 同义词词林及扩展版
2.2.2 汉语框架语义网
2.3 本章小结
第三章 面向微博热门话题的主客观分类方法
3.1 条件随机场模型
3.2 面向微博热门话题主客观分类建模
3.2.1 Logistic回归模型
3.2.2 模型影响因素及判断标准
3.3 话题相关性分类模型
3.3.1 词与热门话题词最大相关度算法
3.3.2 话题相关性分类特征选择
3.4 主客观分类模型
3.4.1 汉语框架网框架距离
3.4.2 观点词集构建方法
3.4.3 主客观分类特征选择
3.5 本章小结
第四章 实验及结果分析
4.1 实验语料来源及预处理
4.1.1 实验语料来源
4.1.2 实验语料预处理
4.2 实验结果评价指标
4.3 实验结果及分析
4.3.1 话题相关性模型结果及分析
4.3.2 主客观分类模型结果及分析
4.3.3 面向微博热门话题主客观分类模型结果及分析
4.4 Baseline及对比实验分析
4.4.1 Baseline
4.4.2 对比实验
4.5 本章小结
第五章 结论与展望
5.1 结论
5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
【参考文献】:
期刊论文
[1]基于同义词词林的文本特征选择方法[J]. 郑艳红,张东站. 厦门大学学报(自然科学版). 2012(02)
[2]基于层次结构的多策略中文微博情感分析和特征抽取[J]. 谢丽星,周明,孙茂松. 中文信息学报. 2012(01)
[3]基于SVM的文本词句情感分析[J]. 杨经,林世平. 计算机应用与软件. 2011(09)
[4]基于同义词词林的词语相似度计算方法[J]. 田久乐,赵蔚. 吉林大学学报(信息科学版). 2010(06)
[5]汉语框架语义知识库及软件描述体系[J]. 郝晓燕,刘伟,李茹,刘开瑛. 中文信息学报. 2007(05)
[6]基于条件随机场的汉语分词系统[J]. 李双龙,刘群,王成耀. 微计算机信息. 2006(28)
[7]Web文本情感分类研究综述[J]. 王洪伟,刘勰,尹裴,廖雅国. 情报学报. 2010 (05)
博士论文
[1]汉语句子框架语义结构分析技术研究[D]. 李茹.山西大学 2012
硕士论文
[1]基于依存特征的汉语框架语义角色自动标注[D]. 王智强.山西大学 2012
[2]Logistic回归模型分析综述及应用研究[D]. 尹建杰.黑龙江大学 2011
[3]情感主体识别与情感迁移分析[D]. 郭巍.大连理工大学 2009
本文编号:3345144
【文章来源】:山西大学山西省
【文章页数】:55 页
【学位级别】:硕士
【文章目录】:
摘要
Contents
中文摘要
ABSTRACT
第一章 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.3 本文研究内容
1.4 论文组织结构
第二章 问题描述及相关资源
2.1 面向微博热门话题的主客观分类问题描述
2.1.1 话题相关性分类子问题描述
2.1.2 主客观分类子问题描述
2.2 相关资源
2.2.1 同义词词林及扩展版
2.2.2 汉语框架语义网
2.3 本章小结
第三章 面向微博热门话题的主客观分类方法
3.1 条件随机场模型
3.2 面向微博热门话题主客观分类建模
3.2.1 Logistic回归模型
3.2.2 模型影响因素及判断标准
3.3 话题相关性分类模型
3.3.1 词与热门话题词最大相关度算法
3.3.2 话题相关性分类特征选择
3.4 主客观分类模型
3.4.1 汉语框架网框架距离
3.4.2 观点词集构建方法
3.4.3 主客观分类特征选择
3.5 本章小结
第四章 实验及结果分析
4.1 实验语料来源及预处理
4.1.1 实验语料来源
4.1.2 实验语料预处理
4.2 实验结果评价指标
4.3 实验结果及分析
4.3.1 话题相关性模型结果及分析
4.3.2 主客观分类模型结果及分析
4.3.3 面向微博热门话题主客观分类模型结果及分析
4.4 Baseline及对比实验分析
4.4.1 Baseline
4.4.2 对比实验
4.5 本章小结
第五章 结论与展望
5.1 结论
5.2 展望
参考文献
攻读学位期间取得的研究成果
致谢
个人简况及联系方式
【参考文献】:
期刊论文
[1]基于同义词词林的文本特征选择方法[J]. 郑艳红,张东站. 厦门大学学报(自然科学版). 2012(02)
[2]基于层次结构的多策略中文微博情感分析和特征抽取[J]. 谢丽星,周明,孙茂松. 中文信息学报. 2012(01)
[3]基于SVM的文本词句情感分析[J]. 杨经,林世平. 计算机应用与软件. 2011(09)
[4]基于同义词词林的词语相似度计算方法[J]. 田久乐,赵蔚. 吉林大学学报(信息科学版). 2010(06)
[5]汉语框架语义知识库及软件描述体系[J]. 郝晓燕,刘伟,李茹,刘开瑛. 中文信息学报. 2007(05)
[6]基于条件随机场的汉语分词系统[J]. 李双龙,刘群,王成耀. 微计算机信息. 2006(28)
[7]Web文本情感分类研究综述[J]. 王洪伟,刘勰,尹裴,廖雅国. 情报学报. 2010 (05)
博士论文
[1]汉语句子框架语义结构分析技术研究[D]. 李茹.山西大学 2012
硕士论文
[1]基于依存特征的汉语框架语义角色自动标注[D]. 王智强.山西大学 2012
[2]Logistic回归模型分析综述及应用研究[D]. 尹建杰.黑龙江大学 2011
[3]情感主体识别与情感迁移分析[D]. 郭巍.大连理工大学 2009
本文编号:3345144
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3345144.html