当前位置:主页 > 科技论文 > 软件论文 >

融合迁移学习的中文命名实体识别

发布时间:2019-01-25 19:42
【摘要】:命名实体识别是自然语言处理研究领域中的一项很重要的基础性任务,是实体关系抽取和事件抽取等高层任务重要基石.如何在缺乏标注语料或只有少量标注语料条件下,提高命名实体识别的性能是自然语言处理领域的一个重要研究方向.针对这一问题,提出一种基于实例的迁移学习算法——TLNER_AdaBoost.该方法通过自动调整训练集中实例样本的权重和计算辅助训练样本的迁移能力来提高训练语料质量,并选取采用不完全标注语料的自学习方法和采用完全标注语料的基于条件随机场的方法来对该方法进行实验对比分析.经实验对比分析得知,本文方法在提高命名实体识别的准确率、召回率和F值的同时,大大降低了人工标注语料的工作量.
[Abstract]:Named entity recognition is an important basic task in the field of natural language processing. It is an important cornerstone of high-level tasks such as entity relation extraction and event extraction. How to improve the performance of named entity recognition is an important research direction in the field of natural language processing. In order to solve this problem, a case-based migration learning algorithm, TLNER_AdaBoost., is proposed. The method improves the quality of the training corpus by automatically adjusting the weight of the sample and calculating the transfer ability of the training sample. The self-learning method using incomplete tagging corpus and the conditional random field method based on fully annotated corpus are selected to compare and analyze the method. The experimental results show that the method not only improves the accuracy, recall rate and F value of named entity recognition, but also greatly reduces the workload of manual tagging corpus.
【作者单位】: 昆明理工大学信息工程与自动化学院;
【基金】:国家自然科学基金项目(61462054,61363044)资助 云南省科技厅面上项目(2015FB135)资助 云南省教育厅科学研究基金重点项目(2014Z021)资助 昆明理工大学省级人培项目(KKSY201403028)资助
【分类号】:TP391.1

【参考文献】

相关期刊论文 前6条

1 何炎祥;罗楚威;胡彬尧;;基于CRF和规则相结合的地理命名实体识别方法[J];计算机应用与软件;2015年01期

2 闫丹辉;毕玉德;;基于规则的越南语命名实体识别研究[J];中文信息学报;2014年05期

3 钟志农;刘方驰;吴烨;伍江江;;主动学习与自学习的中文命名实体识别[J];国防科技大学学报;2014年04期

4 庄福振;罗平;何清;史忠植;;迁移学习研究进展[J];软件学报;2015年01期

5 史荧中;王士同;蒋亦樟;刘培林;;迁移学习支持向量回归机[J];计算机应用;2013年11期

6 赵军;;命名实体识别、排歧和跨语言关联[J];中文信息学报;2009年02期

【共引文献】

相关期刊论文 前10条

1 包乌格德勒;鲍薇;;基于条件随机场的蒙古文地名识别[J];现代计算机(专业版);2017年03期

2 胡杨;冯旭鹏;戴丹;刘利军;黄青松;;最小费用最大流跨领域情感分类框架[J];小型微型计算机系统;2017年01期

3 陈超;沈飞;严如强;;改进LSSVM迁移学习方法的轴承故障诊断[J];仪器仪表学报;2017年01期

4 唐亮;席耀一;赵晓峰;易绵竹;;基于特征相似度的跨语言事件映射[J];计算机应用;2016年S2期

5 罗成;;从中美教材对比视角谈“理想化模型”教学思路——以“质点”模型为例[J];物理教学探讨;2016年12期

6 宋鹏;郑文明;赵力;;基于特征迁移学习方法的跨库语音情感识别[J];清华大学学报(自然科学版);2016年11期

7 阿依古丽·哈力克;艾山·吾买尔;吐尔根·伊布拉音;卡哈尔江·阿比的热西提;买合木提·买买提;;汉维时间数字和量词的识别与翻译研究[J];中文信息学报;2016年06期

8 郑宇;程乐峰;孟科;张睿;李正佳;余涛;;一种基于能源互联网的能源USB系统方案设计[J];新型工业化;2016年10期

9 赵颖;;基于改进SVM的文本混沌性分类优化技术实现[J];现代电子技术;2016年20期

10 樊养余;李祖贺;王凤琴;马江涛;;基于跨领域卷积稀疏自动编码器的抽象图像情绪性分类[J];电子与信息学报;2017年01期

【二级参考文献】

相关期刊论文 前10条

1 蒋亦樟;邓赵红;王士同;;ML型迁移学习模糊系统[J];自动化学报;2012年09期

2 张春元;;基于条件随机场的文本分类模型[J];计算机技术与发展;2011年07期

3 张英锋;马彪;张金乐;陈漫;范昱珩;李文昌;;基于光谱分析和SVM的综合传动故障诊断研究[J];光谱学与光谱分析;2010年06期

4 王明军;周俊;屠s,

本文编号:2415128


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2415128.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7a405***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com