面向产品评论的多文档观点文摘研究
发布时间:2018-04-10 16:33
本文选题:情感分析 + 观点文摘 ; 参考:《哈尔滨工业大学》2016年博士论文
【摘要】:观点文摘,又称情感文摘,是对含有情感信息的主观性文本集合进行文本分析、内容归纳和文摘生成的技术。随着互联网主观性评论文本数量的不断增加,观点文摘的应用需求也随之增加,这些需求为观点文摘的发展带来了动力,同时也为自然语言处理的研究带来了新的机遇和挑战。近些年,观点文摘相关任务的研究受到一些研究者的关注,并取得了一定的成果,研究者们尝试将观点文摘技术应用于决策支持、舆情监测和信息预测等应用领域中。观点文摘主要包含三项研究内容:情感要素抽取、情感极性识别和情感信息归纳,这些内容均属于情感分析的范畴。本文针对观点文摘的三项关键内容进行研究,其中情感要素抽取和情感极性识别属于情感分析的基础性研究,目的在于从评论文本中识别出有效的评价单元(评价属性、评价词语等),并对这些评价单元的极性进行判断;情感信息归纳属于情感分析的应用级任务,目的在于对识别出的重要评价信息进行归纳,从而形成一个简洁、精炼的摘要。本文还对产品的综合排序任务进行了研究。本研究的具体内容包括:基于条件随机域模型的比较要素抽取研究。在基于统计机器学习的比较要素抽取方法中,特征的选择对模型的建立至关重要。本文针对比较要素抽取任务,提出引入浅层句法特征、比较词候选特征和启发式位置特征等语言学相关特征,并将这些特征自动融合到条件随机域学习算法中。实验结果表明,浅层句法特征能够有效的识别短语级的比较要素,比较词候选特征不仅能够弥补比较词训练样本不足的问题,还可以对其他要素的位置进行初步定位,启发式位置特征有助于区分词性相似的要素。该方法可以有效提高比较要素抽取的各项性能指标。基于观点内外部特征相结合的模糊评价词语极性识别。模糊评价词语是指情感极性随上下文的不同而发生改变的词语,以往的研究主要考察评价单元外部的极性特征,而较少关注评价单元内部的特征,因而带来了模糊评价词语极性识别率不高的问题。本文提出了一种将观点内部特征与观点外部特征相结合的无监督极性识别方法,该方法通过引入两种观点内部特征:修饰词语和高频评价搭配,有效解决了模糊评价词语极性识别准确率低的问题;同时结合两种观点外部特征进行极性识别,有效解决了模糊评价词语极性识别召回率低的问题。基于层次分析模型的产品多属性综合排序。综合评价指的是运用多个评价指标对多个参评对象进行评价(排序或择优)。本文针对产品的综合评价问题,提出了一种建模方法,该方法通过构建层次分析模型来完成产品的综合排序,模型首先将综合评价问题按目标层、准则层、子准则层直至具体的参评方案层分解为多个层次,在此基础上进行定量分析,通过计算每一层次各元素对上一层次某元素的优先权重,最终求得各个层次的组合权向量,实现了实体的多属性综合排序。该方法在构建层次分析模型时还结合了图模型并充分考虑了用户的不同需求,有效解决了产品多属性综合排序问题。基于模板的生成式多文档观点文摘。多文档自动文摘任务一直是TAC(Text Analysis Conference)会议的重要评测内容,但是主观性评论文本的多文档自动文摘仍然是一个新颖且具有挑战性的任务。本文针对评论文本的多文档观点文摘任务,提出了一种基于模板的生成式多文档观点文摘方法。该方法首先从评论文档集中提取评价信息(评价实体、评价属性等)并判断情感极性。然后,将这些评价信息映射为标准信息并按照UDA(User-defined Aspects)属性树进行组织。最后是观点文摘的构建,包括文摘结构的规划、文摘模板的设计、文摘句的生成和内容的选择等。本文构建了三种类型的观点文摘:总体文摘、单实体文摘和实体对比文摘,有效探索了中文观点文摘的生成式方法。
[Abstract]:......
【学位授予单位】:哈尔滨工业大学
【学位级别】:博士
【学位授予年份】:2016
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 宣嘉静,孙孝诗;论文摘及文摘工作[J];图书馆学研究;1997年06期
2 彭绮文;;解谜十七年[J];图书馆论坛;2009年05期
3 丘峰;当代中国的文摘工作[J];图书情报知识;1995年01期
4 丘峰;从《文摘工作概论》的出版谈起[J];图书情报工作;1999年04期
5 姜继;;基础文摘工作的现代趋势——在版文摘种种[J];图书馆学通讯;1981年03期
6 赵鑫虎;;从实践谈文摘工作[J];图书与情报;1987年Z1期
7 方玲;;论创立“文摘学”[J];上海师范大学学报(哲学社会科学版);1985年01期
8 毛昨非;;马克思的文摘工作方法初探[J];图书馆学研究;1985年03期
9 吴尚宇;;社会料学文摘种类评析[J];图书馆杂志;1991年06期
10 张辉;文摘的作用与类型[J];山东图书馆季刊;1992年04期
相关博士学位论文 前1条
1 王巍;面向产品评论的多文档观点文摘研究[D];哈尔滨工业大学;2016年
相关硕士学位论文 前1条
1 潘敏;基于情感信息度量的中文情感文摘研究[D];福州大学;2014年
,本文编号:1732061
本文链接:https://www.wllwen.com/shoufeilunwen/xxkjbs/1732061.html