基于多层关系图模型的中文评价对象与评价词抽取方法
本文选题:倾向性分析 + 观点挖掘 ; 参考:《自动化学报》2017年03期
【摘要】:中文评价对象与评价词抽取是文本倾向性分析的重要问题.如何利用评价对象与评价词之间的语法、共现等关系设计模型是提高抽取精度的关键.本文提出了一种基于多层关系图模型的中文评价对象与评价词抽取方法.该方法首先利用词对齐模型抽取评价对象与评价词搭配;然后,考虑评价对象与评价词的依存句法关系、评价对象内部的共现关系和评价词内部的共现关系,建立多层情感关系图,接着利用随机游走方法计算候选评价对象与评价词的置信度;最后,选取置信度高的候选评价对象与评价词作为输出.实验结果表明,与现有的方法相比,本文所提出的方法不仅对评价对象和评价词的抽取精度均有显著提升,而且具有良好的鲁棒性.
[Abstract]:Chinese evaluation object and word extraction is an important problem in text orientation analysis. How to make use of the grammar and co-occurrence model between the evaluation object and the evaluation word is the key to improve the extraction accuracy. In this paper, a method of extracting Chinese evaluation objects and words based on multilevel relational graph model is proposed. The method firstly extracts the collocation between evaluation object and evaluation word by word alignment model, and then considers the dependent syntactic relation between evaluation object and evaluation word, the co-occurrence relation within evaluation object and the co-occurrence relationship within evaluation word. The multilevel affective relationship graph is established, and then the confidence degree of candidate evaluation object and evaluation word is calculated by random walk method. Finally, the candidate evaluation object and evaluation word with high confidence degree are selected as the output. The experimental results show that compared with the existing methods, the proposed method not only improves the accuracy of evaluation object and evaluation term extraction significantly, but also has good robustness.
【作者单位】: 福州大学数学与计算机科学学院;福建省网络计算与智能信息处理重点实验室(福州大学);福建江夏学院电子信息科学学院;中国科学院计算技术研究所网络数据科学与技术重点实验室;
【基金】:国家自然科学基金青年项目(61300105) 中国科学院网络数据科学与技术重点实验室开放基金课题(CASNDST20140X)资助~~
【分类号】:TP391.1
【相似文献】
相关期刊论文 前10条
1 石桢;姚天f ;;一种基于统计和规则的核心地名抽取方法[J];微型电脑应用;2013年02期
2 张世辉;一种新的基于距离的汉字笔画抽取方法[J];计算机工程;2003年14期
3 王大亮;涂序彦;郑雪峰;佟子健;;多策略融合的搭配抽取方法[J];清华大学学报(自然科学版);2008年04期
4 杨建明;;关系抽取方法研究[J];电子技术;2009年04期
5 孙继鹏;贾民;刘增宝;;一种面向文本的概念抽取方法的研究[J];计算机应用与软件;2009年09期
6 郑伟;吕建新;张建伟;;文本分类中特征预抽取方法研究[J];情报科学;2011年01期
7 肖明军,张巍,邹翔,蔡庆生;一种多策略联合信息抽取方法[J];小型微型计算机系统;2005年04期
8 郝博一;夏云庆;邬晓钧;郑方;刘轶;;基于泛化和繁殖的自举式意见目标抽取方法[J];清华大学学报(自然科学版);2009年S1期
9 栗春亮;朱艳辉;徐叶强;;中文产品评论中属性词抽取方法研究[J];计算机工程;2011年12期
10 蔡虹,叶水生;基于KPS的Web信息抽取[J];计算机与现代化;2005年06期
相关会议论文 前10条
1 宋涛;李素建;;基于流形排序的领域词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
2 卞真旭;;一种关键词抽取方法研究[A];2011年安徽省智能电网技术论坛论文集[C];2011年
3 罗斐;毛宇光;;基于领域分类的查询接口模式抽取方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
4 栗春亮;朱艳辉;徐叶强;;中文产品评论中属性词抽取方法研究[A];第六届全国信息检索学术会议论文集[C];2010年
5 刘昊;王健;林鸿飞;;一种模板与图核融合的蛋白质关系抽取方法[A];第六届全国信息检索学术会议论文集[C];2010年
6 翁伟;王厚峰;;基于LDA的关键词抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 何莉;林鸿飞;;一种面向WEB的生物医学领域英汉术语翻译对抽取方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 左云存;宗成庆;;基于HMM的短语翻译对抽取方法[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 王裴岩;张桂平;白宇;;一种基于核函数的技术关键词连接关系抽取方法[A];第六届全国信息检索学术会议论文集[C];2010年
10 蒲宇达;关毅;王强;;基于数据挖掘思想的网页正文抽取方法的研究[A];第三届学生计算语言学研讨会论文集[C];2006年
相关博士学位论文 前2条
1 刘胜宇;生物医学文本中药物信息抽取方法研究[D];哈尔滨工业大学;2016年
2 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
相关硕士学位论文 前10条
1 陈倩;基于特征模型的跨领域信息抽取方法研究[D];上海大学;2015年
2 刘骁;基于产品评论的意见抽取方法研究[D];黑龙江大学;2015年
3 洪军建;面向社会网络应用的人物关系抽取方法研究[D];西藏大学;2016年
4 梅莉莉;基于领域特殊性和统计语言知识的新词抽取方法[D];北京理工大学;2016年
5 陈亚东;面向数据稀疏问题的英文事件抽取研究[D];苏州大学;2016年
6 朱珠;基于双语的事件抽取方法研究[D];苏州大学;2016年
7 余伟;基于领域知识的Web信息抽取方法研究[D];安徽工程大学;2016年
8 陈茂榕;领域依赖的Web信息抽取系统设计与实现[D];东南大学;2016年
9 刘征;作者资讯中的有用文本信息抽取方法研究[D];东北师范大学;2016年
10 吕云云;基于集成学习的中文观点句抽取方法研究[D];山西大学;2013年
,本文编号:1848442
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1848442.html