面向散文体裁的情感词语识别方法研究
发布时间:2024-05-12 00:14
阅读理解是自然语言处理领域的一个重要研究方向,现有阅读理解大多是针对语料格式相对简单,问题形式相对固定的任务,但是高考文学类作品阅读理解问题复杂多样,文学作品以中国现代散文为主,作品取材广泛,语言凝练,意境深邃,理解困难。因此,本文面向散文阅读理解任务,针对散文中的情感词语识别开展研究。从粒度最小的词语单位出发,研究情感词语的识别技术,主要研究工作如下:(1)面向散文的情感词典和语料库构建。通过对散文文本独有特点的分析,发现散文情感大多细腻复杂,结合高考散文阅读理解答题的需要,许多问题涉及原文中的情感分析或修辞方法识别,若能构建散文阅读理解的基础资源,可以提升问题的解答效果。本文建立情感词典,并收集80190篇散文,其中标注1140条词语及其情绪标签、2625条动词隐喻句及其情感类别,最后分别对标注数据语料进行分析、总结。(2)面向散文的低频情感词语抽取与情绪标签确定。散文是一种抒发作者真情实感、写作方式灵活的记叙类文学体裁,其表现形式更加多元化,表达方式更加婉转,情感表达更加细腻等。通过词语之间的共现关系确定词语间的相关性,再利用Word2Vec计算词语间的语义相似度。在此基础上,构...
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
本文编号:3970572
【文章页数】:61 页
【学位级别】:硕士
【部分图文】:
图3.1各类情感词语情绪倾向判别结果
图3.1各类情感词语情绪倾向判别结果.1可知:“哀”情绪类的各项评价指标均低于另外三种。其原因是由这两种情绪关系紧密,某个词语可能同时含有两种情绪,但别更偏向于概率大的这种情绪。例如,“尔虞我诈”既包含哀”的情绪,在本文中人工判别其为“哀”情绪,而在实验”情绪。因此,模型判....
图3.2不同的权重β下游走模型判别情感词语情绪倾向结果
图3.1各类情感词语情绪倾向判别结果图3.1可知:”和“哀”情绪类的各项评价指标均低于另外三种。其原因是由于中,这两种情绪关系紧密,某个词语可能同时含有两种情绪,但是的判别更偏向于概率大的这种情绪。例如,“尔虞我诈”既包含“怒含“哀”的情绪,在本文中人工判别其为“哀”情绪....
图3.3表示候选词语与种子集之间的共现关系度量
3.3表示候选词语与种子集之间的共现关系度1节中词语之间的共现关系度量。连线上的,若没有连线,说明两个词语没有共现关喜哀乐琳琅满目怒惧轻触熟透萎缩生疏避风港天马行空不解之缘0.3590.1940.3010.3540.3230.2360.2530.3173.4表示候选词语与....
图3.4表示候选词语与种子集之间的语义关系度量
例展示节两步传播算法的性能,选取部分词语,后情绪倾向判断正确,其示意图见图3.3、3.3表示候选词语与种子集之间的共现关系度1节中词语之间的共现关系度量。连线上的,若没有连线,说明两个词语没有共现关喜0.359
本文编号:3970572
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3970572.html