当前位置:主页 > 管理论文 > 移动网络论文 >

中文微博命名体识别

发布时间:2017-12-20 19:00

  本文关键词:中文微博命名体识别 出处:《四川大学学报(自然科学版)》2015年03期  论文类型:期刊论文


  更多相关文章: 微博 条件随机场 命名实体 三级粒度特征 短文本


【摘要】:近年来微博的快速发展为命名体识别提供了新的载体,同时微博的特点也为命名体识别研究带来了挑战.针对微博特点,本文提出了基于拼音相似距离以及文本相似距离聚类算法对微博文本进行规范化,消除了微博的语言表达不规范造成的干扰.同时,本文还提出了篇章级、句子级以及词汇级三级粒度的特征提取,使用条件随机场模型进行训练数据,并识别命名体,采用由微博文本相似聚类获得的实体关系类对命名体类型进行修正.由于缺少大量的微博训练数据,本文采用半监督学习框架训练模型.通过对新浪微博数据的实验结果表明,本方法能够有效地提高微博中命名体识别的效果.
【作者单位】: 四川民族学院计算机科学系;四川大学计算机学院;
【基金】:国家自然科技基金项目(61332066,81373239)
【分类号】:TP391.1;TP393.092
【正文快照】: 1引言随着中国信息产业的快速发展,中文信息处理技术已然变得越来越重要.在语言文本中,命名实体是主要的信息载体,同时也是文本中的基本信息单位,因此,正确的识别命名体是理解文本的前提,也是人们理解自然语言的基础.目前,针对正式文本中的命名体识别研究[1-5]已经较为成熟,而

【参考文献】

中国期刊全文数据库 前4条

1 朱敏;贾真;左玲;吴安峻;陈方正;柏玉;;中文微博实体链接研究[J];北京大学学报(自然科学版);2014年01期

2 邱泉清;苗夺谦;张志飞;;中文微博命名实体识别[J];计算机科学;2013年06期

3 姜仁会;王挺;唐晋韬;;面向微博文本的命名实体识别[J];计算机与数字工程;2014年04期

4 周昆;胡学钢;;一种基于本体论和规则匹配的中文人名识别方法[J];微计算机信息;2010年31期

【共引文献】

中国期刊全文数据库 前5条

1 王鹏;李成城;;基于修辞结构理论的文本结构自动分析[J];电子技术与软件工程;2013年19期

2 舒佳根;惠浩添;钱龙华;朱巧明;;一个中文实体链接语料库的建设[J];北京大学学报(自然科学版);2015年02期

3 吴冲冲;;基于集成学习的中文微博情感分类方法[J];科技传播;2014年16期

4 周鹏;蔡淑琴;石双元;袁乾;;微博危机事件损害性评价研究[J];情报杂志;2013年11期

5 汪泱;古丽拉·阿东别克;户冰心;牛宁宁;;基于条件随机场的哈萨克语基本短语自动识别[J];计算机工程与设计;2014年10期

中国博士学位论文全文数据库 前3条

1 豆增发;生物命名实体识别及生物文本分类[D];西安电子科技大学;2013年

2 付瑞吉;开放域命名实体识别及其层次化类别获取[D];哈尔滨工业大学;2014年

3 郭宇航;基于上下文的实体链指技术研究[D];哈尔滨工业大学;2014年

中国硕士学位论文全文数据库 前5条

1 戴思明;互联网文本热点信息实体识别研究及应用[D];华南理工大学;2012年

2 臧勇真;基于统计和规则的中文人名识别研究与实现[D];西南交通大学;2013年

3 彭新茗;基于多层学习的病历实体识别算法设计与实现[D];东北大学;2013年

4 荀晶;面向微博数据的命名实体识别研究与实现[D];东北大学;2013年

5 薛程元;面向列表型知识库的组织机构实体链接方法研究[D];华东理工大学;2015年

【二级参考文献】

中国期刊全文数据库 前10条

1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期

2 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期

3 刘群,张华平,俞鸿魁,程学旗;基于层叠隐马模型的汉语词法分析[J];计算机研究与发展;2004年08期

4 崔世起;刘群;孟遥;于浩;西野文人;;基于大规模语料库的新词检测[J];计算机研究与发展;2006年05期

5 胡文博;都云程;吕学强;施水才;;基于多层条件随机场的中文命名实体识别[J];计算机工程与应用;2009年01期

6 张晓艳;王挺;陈火旺;;命名实体识别研究[J];计算机科学;2005年04期

7 缪建明;张全;;一种基于概念关联式的词义消岐方法[J];计算机科学;2010年01期

8 郑斐然;苗夺谦;张志飞;高灿;;一种中文微博新闻话题检测的方法[J];计算机科学;2012年01期

9 姜维;王晓龙;关毅;赵健;;基于多知识源的中文词法分析系统[J];计算机学报;2007年01期

10 王丹;樊兴华;;面向短文本的命名实体识别[J];计算机应用;2009年01期

中国硕士学位论文全文数据库 前2条

1 杨华;基于最大熵模型的中文命名实体识别方法研究[D];哈尔滨工程大学;2008年

2 周昆;基于规则的命名实体识别研究[D];合肥工业大学;2010年



本文编号:1313041

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1313041.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户c8f77***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com