面向微博的新词发现和情感词典构建方法研究
发布时间:2023-04-02 14:44
随着科学技术的迅猛发展,越来越多的人使用微博平台,从而产生了大量的微博,而且大部分微博都包含发表人的情感倾向。基于情感词典的微博情感分析方法是目前判断微博情感极性的一种重要方法,但因为微博自身的特点,随意、口语化且不正规,产生了许多的网络新词,减少了现有的基础情感词典对微博倾向分析的作用和意义;大量微博的产生导致手动建立情感词典费时费力且效果不佳,所以如何识别新词和自动构建情感词典成为当前微博情感分析中亟待解决的问题。针对上述问题,本文做了三方面的工作:(1)提出了基于互信息和邻接熵的新词发现算法如何快速高效的识别新词是自然语言处理中一项非常重要的任务,针对目前新词发现存在的问题,提出了一种从左至右逐字在未切词的微博语料中发现新词的方法。通过计算候选词语与右邻接字的互信息来逐步扩展候选词语,获得候选新词集;通过计算邻接熵、删除候选新词的首尾停用词和过滤旧词语等方法来筛选新词,完成新词词典的构建。实验结果表明,本文提出的新词发现方法可以有效的识别新词。(2)提出了基于Word2Vec和句子内部关系的自动构建情感词典的方法自动构建情感词典是情感分析中一项基础且重要的任务,针对当前构建情感词...
【文章页数】:44 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和研究意义
1.2 研究现状及分析
1.2.1 新词识别
1.2.2 情感词典构建
1.2.3 研究现状的小结
1.3 研究内容
1.4 论文组织结构
1.5 本章小结
第二章 基于互信息和邻接熵的新词发现算法
2.1 主要技术
2.1.1 互信息
2.1.2 邻接熵
2.2 基于互信息和邻接熵的新词发现算法
2.2.1 本章的改进思路
2.2.2 算法流程
2.3 实验
2.3.1 数据集
2.3.2 评价指标
2.3.3 实验结果
2.4 本章小结
第三章 基于Word2Vec和句子内部关系的自动构建情感词典的方法
3.1 相关知识
3.1.1 AF-IDF方法
3.1.2 Word2Vec模型
3.2 自动构建情感词典的方法
3.2.1 算法流程
3.2.2 实验语料的预处理
3.2.3 种子词的获取
3.2.4 候选情感词的提取
3.2.5 基于Word2Vec的TwoSim方法
3.2.6 基于句子内部关系的方法
3.2.7 情感词典的构建
3.3 实验
3.3.1 数据集
3.3.2 评价指标
3.3.3 实验结果
3.4 本章小结
第四章 基于情感词典的微博情感分析方法
4.1 相关词典的构建
4.1.1 新词词典和情感词典
4.1.2 修饰词典
4.1.3 连词词典
4.2 基于情感词典的微博倾向性分析方法
4.2.1 包含情感词语的句子的情感分析
4.2.2 不包含情感词语的句子的情感分析
4.3 实验
4.3.1 数据集
4.3.2 评价指标
4.3.3 实验结果
4.4 本章小结
第五章 总结与展望
5.1 工作总结
5.2 研究展望
参考文献
攻读硕士学位期间的主要成果
致谢
本文编号:3779407
【文章页数】:44 页
【学位级别】:硕士
【文章目录】:
摘要
ABSTRACT
第一章 绪论
1.1 研究背景和研究意义
1.2 研究现状及分析
1.2.1 新词识别
1.2.2 情感词典构建
1.2.3 研究现状的小结
1.3 研究内容
1.4 论文组织结构
1.5 本章小结
第二章 基于互信息和邻接熵的新词发现算法
2.1 主要技术
2.1.1 互信息
2.1.2 邻接熵
2.2 基于互信息和邻接熵的新词发现算法
2.2.1 本章的改进思路
2.2.2 算法流程
2.3 实验
2.3.1 数据集
2.3.2 评价指标
2.3.3 实验结果
2.4 本章小结
第三章 基于Word2Vec和句子内部关系的自动构建情感词典的方法
3.1 相关知识
3.1.1 AF-IDF方法
3.1.2 Word2Vec模型
3.2 自动构建情感词典的方法
3.2.1 算法流程
3.2.2 实验语料的预处理
3.2.3 种子词的获取
3.2.4 候选情感词的提取
3.2.5 基于Word2Vec的TwoSim方法
3.2.6 基于句子内部关系的方法
3.2.7 情感词典的构建
3.3 实验
3.3.1 数据集
3.3.2 评价指标
3.3.3 实验结果
3.4 本章小结
第四章 基于情感词典的微博情感分析方法
4.1 相关词典的构建
4.1.1 新词词典和情感词典
4.1.2 修饰词典
4.1.3 连词词典
4.2 基于情感词典的微博倾向性分析方法
4.2.1 包含情感词语的句子的情感分析
4.2.2 不包含情感词语的句子的情感分析
4.3 实验
4.3.1 数据集
4.3.2 评价指标
4.3.3 实验结果
4.4 本章小结
第五章 总结与展望
5.1 工作总结
5.2 研究展望
参考文献
攻读硕士学位期间的主要成果
致谢
本文编号:3779407
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3779407.html