英文评论文本的情感分类和评价对象识别研究
发布时间:2021-08-12 19:06
近年来随着电子商务和社交媒体的迅速发展,越来越多的人活跃于网络中并产生海量文本数据,其中包含着大量的情感信息,为了挖掘和获取文本中有价值的情感信息,产品评论文本的情感分析研究受到越来越多的关注。文本情感分析是挖掘人们在主观性网络文本中表达的态度、情绪。本文考虑到在判断文本的情感倾向时不同句子的重要程度不同,对英文评论文本进行基于关键句抽取的情感分类。同时,本文对评论文本中细粒度的评价对象进行识别,使情感分析工作更加细化。具体研究工作如下:在基于关键句抽取的情感分类研究中,针对已有的方法大都是基于特征属性权重抽取情感关键句,忽略了Title和上下文信息的问题,本文提出了基于Title和加权TextRank抽取关键句的情感分类研究。首先通过两个途径抽取情感关键句,一方面构建扩展语义规则模板和情感词典,基于此计算Title的情感得分,从而判断Title的贡献度,以此来决定Title作为情感关键句的条数;另一方面,根据加权TextRank算法思想,在文本正文中构建一个情感句加权有向图来提取关键句,并详细介绍了四个影响有向边权重的因素。然后将情感关键句、细节句和全文句得到的情感分类结果分别作为特...
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
线性可分支持向量机D={(x,y),(x,y),...,(x,y)}
第二章相关内容和方法介绍12接近线性可分时,引入松弛变量让模型能容忍一些错误,称为线性支持向量机,见图2.2。图2.2线性支持向量机现实生活中还有很多数据是线性不可分时,比如二维空间中的异或问题,利用高维映射方法可以将其转换为线性可分问题,如将其映射到三维空间中再进行线性分类。支持向量机中核函数就是这个原理,当数据在初始空间中无法线性划分时,通过核技巧将其映射到更高维空间中进行线性划分,称为非线性支持向量机,见图2.3。图2.3非线性支持向量机2.3.3概率图模型概率图模型(ProbabilisticGraphicalModel,PGM)是将变量之间依赖关系用图表示,样本数据用图G(V,E)建模,节点V为随机变量,边E为概率依赖关系,通常用Y=(y1,y2,...,yn)为随机变量建模,具有联合概率分布P(Y)。概率图模型是一个统称,其中经典的标注模型有隐马尔可夫模型(HiddenMarkov
第二章相关内容和方法介绍12接近线性可分时,引入松弛变量让模型能容忍一些错误,称为线性支持向量机,见图2.2。图2.2线性支持向量机现实生活中还有很多数据是线性不可分时,比如二维空间中的异或问题,利用高维映射方法可以将其转换为线性可分问题,如将其映射到三维空间中再进行线性分类。支持向量机中核函数就是这个原理,当数据在初始空间中无法线性划分时,通过核技巧将其映射到更高维空间中进行线性划分,称为非线性支持向量机,见图2.3。图2.3非线性支持向量机2.3.3概率图模型概率图模型(ProbabilisticGraphicalModel,PGM)是将变量之间依赖关系用图表示,样本数据用图G(V,E)建模,节点V为随机变量,边E为概率依赖关系,通常用Y=(y1,y2,...,yn)为随机变量建模,具有联合概率分布P(Y)。概率图模型是一个统称,其中经典的标注模型有隐马尔可夫模型(HiddenMarkov
【参考文献】:
期刊论文
[1]基于LSTM网络的评价对象和评价词抽取[J]. 李盛秋,赵妍妍,秦兵,刘挺. 智能计算机与应用. 2017(05)
[2]基于加权TextRank的新闻关键事件主题句提取[J]. 蒲梅,周枫,周晶晶,严馨,周兰江. 计算机工程. 2017(08)
[3]PORSC:融合用户个性化特征的在线评论情感分类模型[J]. 宋晓勇,吕品,陈年生. 复旦学报(自然科学版). 2017(03)
[4]情感倾向分析在舆情监控方面的研究[J]. 王林,李昀泽. 微型机与应用. 2017(05)
[5]基于迭代两步CRF模型的评价对象与极性抽取研究[J]. 张盛,李芳. 中文信息学报. 2015(01)
[6]基于情感关键句抽取的情感分类研究[J]. 林政,谭松波,程学旗. 计算机研究与发展. 2012(11)
[7]基于主题情感混合模型的无监督文本情感分析[J]. 孙艳,周学广,付伟. 北京大学学报(自然科学版). 2013(01)
[8]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
本文编号:3338898
【文章来源】:安徽大学安徽省 211工程院校
【文章页数】:68 页
【学位级别】:硕士
【部分图文】:
线性可分支持向量机D={(x,y),(x,y),...,(x,y)}
第二章相关内容和方法介绍12接近线性可分时,引入松弛变量让模型能容忍一些错误,称为线性支持向量机,见图2.2。图2.2线性支持向量机现实生活中还有很多数据是线性不可分时,比如二维空间中的异或问题,利用高维映射方法可以将其转换为线性可分问题,如将其映射到三维空间中再进行线性分类。支持向量机中核函数就是这个原理,当数据在初始空间中无法线性划分时,通过核技巧将其映射到更高维空间中进行线性划分,称为非线性支持向量机,见图2.3。图2.3非线性支持向量机2.3.3概率图模型概率图模型(ProbabilisticGraphicalModel,PGM)是将变量之间依赖关系用图表示,样本数据用图G(V,E)建模,节点V为随机变量,边E为概率依赖关系,通常用Y=(y1,y2,...,yn)为随机变量建模,具有联合概率分布P(Y)。概率图模型是一个统称,其中经典的标注模型有隐马尔可夫模型(HiddenMarkov
第二章相关内容和方法介绍12接近线性可分时,引入松弛变量让模型能容忍一些错误,称为线性支持向量机,见图2.2。图2.2线性支持向量机现实生活中还有很多数据是线性不可分时,比如二维空间中的异或问题,利用高维映射方法可以将其转换为线性可分问题,如将其映射到三维空间中再进行线性分类。支持向量机中核函数就是这个原理,当数据在初始空间中无法线性划分时,通过核技巧将其映射到更高维空间中进行线性划分,称为非线性支持向量机,见图2.3。图2.3非线性支持向量机2.3.3概率图模型概率图模型(ProbabilisticGraphicalModel,PGM)是将变量之间依赖关系用图表示,样本数据用图G(V,E)建模,节点V为随机变量,边E为概率依赖关系,通常用Y=(y1,y2,...,yn)为随机变量建模,具有联合概率分布P(Y)。概率图模型是一个统称,其中经典的标注模型有隐马尔可夫模型(HiddenMarkov
【参考文献】:
期刊论文
[1]基于LSTM网络的评价对象和评价词抽取[J]. 李盛秋,赵妍妍,秦兵,刘挺. 智能计算机与应用. 2017(05)
[2]基于加权TextRank的新闻关键事件主题句提取[J]. 蒲梅,周枫,周晶晶,严馨,周兰江. 计算机工程. 2017(08)
[3]PORSC:融合用户个性化特征的在线评论情感分类模型[J]. 宋晓勇,吕品,陈年生. 复旦学报(自然科学版). 2017(03)
[4]情感倾向分析在舆情监控方面的研究[J]. 王林,李昀泽. 微型机与应用. 2017(05)
[5]基于迭代两步CRF模型的评价对象与极性抽取研究[J]. 张盛,李芳. 中文信息学报. 2015(01)
[6]基于情感关键句抽取的情感分类研究[J]. 林政,谭松波,程学旗. 计算机研究与发展. 2012(11)
[7]基于主题情感混合模型的无监督文本情感分析[J]. 孙艳,周学广,付伟. 北京大学学报(自然科学版). 2013(01)
[8]文本情感分析[J]. 赵妍妍,秦兵,刘挺. 软件学报. 2010(08)
本文编号:3338898
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3338898.html
最近更新
教材专著