新闻评论的评价对象抽取研究
发布时间:2021-09-23 15:15
新闻评论评价对象抽取是挖掘网民观点的一种重要技术,该任务旨在对新闻评论文本进行分析,抽取出其中包含的评价对象。新闻评论可以方便的获取到对应的正文内容,新闻正文内容和评论具有很高的相关性。基于上述特点,本文充分利用新闻正文内容,提出融合新闻正文的评价对象抽取模型。针对现有评价对象抽取模型需要大量训练样本而数据集样本较少的问题,本文提出基于外部知识辅助数据集扩充的评价对象抽取方法。具体研究工作包含以下内容:1.融合正文信息的评价对象抽取。本研究结合新闻评论的特点,首先将新闻正文通过中心命名实体识别获取候选评价对象,然后利用获取的候选评价对象构造对应的特征向量,接着将候选评价对象对应的特征向量和评论文本的向量融合输入循环神经网络学习到文本和候选评价对象的特征,最后输入到条件随机场进行序列标注抽取出评论中的评价对象。实验结果表明,融合新闻正文信息后抽取效果有显著提升,表明该方法在融合正文信息后可以更好的抽取新闻评论中的评价对象。2.外部知识辅助数据集扩充的评价对象抽取。针对现有深度学习模型需要大量训练样本才能充分训练而数据集样本少的问题。本文提出一种基于外部知识辅助数据集扩充的评价对象抽取方法...
【文章来源】:中国科学院大学(中国科学院大学人工智能学院)北京市
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图1.2新闻评论示例??Figure?1.2?Example?of?news?comment??2??
0?Q?0.1?[:??:eVi?—_1….―….,?……一……ept+i?:??jB±ll?B±3|?gj±ll?&5±l|?;??:El?E?S?feffe?S?3?i??:l?0.3?OS?0?0?0?0.2?0?0?0?11?0?0?0?0?f?0?0?0?0?];??ea{'?-?^?:?’?a?^;??Layer?t?;?1?El?B]?1??Fish?buroer?is?the?best?dish?it?tastes?fresh?:??图1.4多层注意力网络模型图??Figure?1.4?Multilayer?attention?network?model??——如果两个实体在知识库中存在某种对应关系,那么就认为所有包含这两个??实体的句子的实体的关系都是该种关系。作者基于此假设在构建的知识库的指??导下进行实体关系的抽龋但是这个假设非常的泛化,很多的实体都没有什么??关系,仅仅是出现在同一个句子中。而且很多的实体之间不止一种关系,可能??有很多种关系,例如奥巴马和美国的关系,可能是born?in,也就是奥巴马出生在??美国,可能是isthepresidentof关系,奧巴马是美国的总统。基于这个假设条件下??的关系抽取存在两个明显的问题,第一个问题是训练数据集会产生大量的错误??的标注,又如两个实体存在多种关系或者根本就不存在任务关系,这样作为训??练数据就会对关系抽取器产生影响。第二个问题是在数据预处理时,由于自然??语言处理工具带来的误差,例如命名实体识别工具、分词工具和词性标注工具??等。使用越多的工具进行预处理就会引入越多的误差,在整个任务的pipeline上?
?新闻评论的评价对象抽取研究???--1????”0.8?,??T??j-?-0.4??/?--0.2??-10?-8?-6?-2?丨丨?2?4?6?8?10???|?|??>?—*-* ̄*T"*^?j?fill?II??图2.1?sigmoid函数不意图??Figure?2.1?Diagram?of?sigmoid?function??记忆』-f——k5)?-0?c,??输出门:??,?-(?)?°,??遗忘门:输入门:候选记忆t?f??1?1?a?细胞:tanh?:<r??隐藏状态:?)?f?C'?)?)??H-'?vZ?j??输入:'??g?I全连接层和激活函数?(3按元素运算符?i?r复制?连结??图2.2长短期记忆网络示意图??Figure?2.2?Diagram?of?long?short-term?memory?network??12??
【参考文献】:
期刊论文
[1]使用深度长短时记忆模型对于评价词和评价对象的联合抽取[J]. 沈亚田,黄萱菁,曹均阔. 中文信息学报. 2018(02)
[2]评价对象抽取研究综述[J]. 蒋盛益,郭林东,王连喜,符斯慧. 自动化学报. 2018(07)
[3]深度学习中汉语字向量和词向量结合方式探究[J]. 李伟康,李炜,吴云芳. 中文信息学报. 2017(06)
[4]基于CRFs和领域本体的中文微博评价对象抽取研究[J]. 丁晟春,吴婧婵媛,李霄. 中文信息学报. 2016(04)
[5]基于浅层句法特征的评价对象抽取研究[J]. 徐冰,赵铁军,王山雨,郑德权. 自动化学报. 2011(10)
[6]评价对象抽取及其倾向性分析[J]. 刘鸿宇,赵妍妍,秦兵,刘挺. 中文信息学报. 2010(01)
本文编号:3405939
【文章来源】:中国科学院大学(中国科学院大学人工智能学院)北京市
【文章页数】:76 页
【学位级别】:硕士
【部分图文】:
图1.2新闻评论示例??Figure?1.2?Example?of?news?comment??2??
0?Q?0.1?[:??:eVi?—_1….―….,?……一……ept+i?:??jB±ll?B±3|?gj±ll?&5±l|?;??:El?E?S?feffe?S?3?i??:l?0.3?OS?0?0?0?0.2?0?0?0?11?0?0?0?0?f?0?0?0?0?];??ea{'?-?^?:?’?a?^;??Layer?t?;?1?El?B]?1??Fish?buroer?is?the?best?dish?it?tastes?fresh?:??图1.4多层注意力网络模型图??Figure?1.4?Multilayer?attention?network?model??——如果两个实体在知识库中存在某种对应关系,那么就认为所有包含这两个??实体的句子的实体的关系都是该种关系。作者基于此假设在构建的知识库的指??导下进行实体关系的抽龋但是这个假设非常的泛化,很多的实体都没有什么??关系,仅仅是出现在同一个句子中。而且很多的实体之间不止一种关系,可能??有很多种关系,例如奥巴马和美国的关系,可能是born?in,也就是奥巴马出生在??美国,可能是isthepresidentof关系,奧巴马是美国的总统。基于这个假设条件下??的关系抽取存在两个明显的问题,第一个问题是训练数据集会产生大量的错误??的标注,又如两个实体存在多种关系或者根本就不存在任务关系,这样作为训??练数据就会对关系抽取器产生影响。第二个问题是在数据预处理时,由于自然??语言处理工具带来的误差,例如命名实体识别工具、分词工具和词性标注工具??等。使用越多的工具进行预处理就会引入越多的误差,在整个任务的pipeline上?
?新闻评论的评价对象抽取研究???--1????”0.8?,??T??j-?-0.4??/?--0.2??-10?-8?-6?-2?丨丨?2?4?6?8?10???|?|??>?—*-* ̄*T"*^?j?fill?II??图2.1?sigmoid函数不意图??Figure?2.1?Diagram?of?sigmoid?function??记忆』-f——k5)?-0?c,??输出门:??,?-(?)?°,??遗忘门:输入门:候选记忆t?f??1?1?a?细胞:tanh?:<r??隐藏状态:?)?f?C'?)?)??H-'?vZ?j??输入:'??g?I全连接层和激活函数?(3按元素运算符?i?r复制?连结??图2.2长短期记忆网络示意图??Figure?2.2?Diagram?of?long?short-term?memory?network??12??
【参考文献】:
期刊论文
[1]使用深度长短时记忆模型对于评价词和评价对象的联合抽取[J]. 沈亚田,黄萱菁,曹均阔. 中文信息学报. 2018(02)
[2]评价对象抽取研究综述[J]. 蒋盛益,郭林东,王连喜,符斯慧. 自动化学报. 2018(07)
[3]深度学习中汉语字向量和词向量结合方式探究[J]. 李伟康,李炜,吴云芳. 中文信息学报. 2017(06)
[4]基于CRFs和领域本体的中文微博评价对象抽取研究[J]. 丁晟春,吴婧婵媛,李霄. 中文信息学报. 2016(04)
[5]基于浅层句法特征的评价对象抽取研究[J]. 徐冰,赵铁军,王山雨,郑德权. 自动化学报. 2011(10)
[6]评价对象抽取及其倾向性分析[J]. 刘鸿宇,赵妍妍,秦兵,刘挺. 中文信息学报. 2010(01)
本文编号:3405939
本文链接:https://www.wllwen.com/kejilunwen/shengwushengchang/3405939.html
最近更新
教材专著