中文新词识别研究概述
本文关键词:中文新词识别研究概述
【摘要】:新词识别是中文信息处理的重要课题,但因新词产生的速度快,语法、语用灵活,词典难以及时收录等问题使新词识别成为了中文信息处理领域的难点和热点问题。新词识别研究的方法主要有规则方法、统计方法以及规则与统计相结合的方法。新词识别的规则主要有新词词性规则和新词构词模式规则。统计方法主要通过计算词的TF/IDF值、词内部概率、词的频次对比、词的临接类别等进行新词识别。最后该文总结了中文新词识别研究中存在的问题,指出未来研究的方向。
【作者单位】: 中央民族大学少数民族语言文学系;内蒙古民族大学文学院;
【分类号】:TP391.1
【正文快照】: 新词识别研究是中文信息处理中的一个基础性问题,它直接关系到中文分词的效果,继而影响到后续各级的信息处理问题。在应用领域中新词识别对于信息检索、数据挖掘、舆情监测、机器翻译等各个方面都将产生影响。因此,新词识别是中文信息处理的一个重要课题,但因新词产生的速度快
【相似文献】
中国期刊全文数据库 前10条
1 ;中文信息处理基础性国家标准出台[J];军民两用技术与产品;2000年05期
2 郭弘;信息—中国造——孙茂松教授谈中文信息处理领域面临的机遇和挑战[J];微电脑世界;2000年16期
3 ;民族软件的基础——中文信息处理技术[J];数字与缩微影像;2003年03期
4 ;中文信息处理战略研讨会在南宁召开[J];中文信息学报;2007年04期
5 苗夺谦;卫志华;王睿智;张志飞;;“中文信息处理”实践教学探索[J];计算机教育;2010年17期
6 石天;中文信息处理──中国企业面临严峻挑战[J];电脑技术;1997年05期
7 ;中文信息处理新秀──四通利方软件在'97广交会上[J];信息经济与技术;1997年06期
8 陈力为,袁琦;跨世纪的中文信息处理基础研究和产品开发[J];信息系统工程;1998年12期
9 王佳存;中文信息处理产业的发展方向探讨[J];科学与管理;1998年01期
10 陈小荷;中文信息处理概述[J];南京师范大学文学院学报;2002年01期
中国重要会议论文全文数据库 前10条
1 李竹;;中文信息处理与现代汉语词类研究[A];世纪之交的中国应用语言学研究——第二届全国语言文字应用学术研讨会论文集[C];1998年
2 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 ;我国中文信息处理技术的发展与展望[A];科技进步与学科发展——“科学技术面向新世纪”学术年会论文集[C];1998年
4 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
5 ;中科院计算所中文信息处理技术简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
6 ;中文信息处理重大成果汇报展方正集团展示内容介绍[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
7 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年
8 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年
9 ;863计划中文信息处理与智能人机接口基础数据库内容及其共享模式简介[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
10 陆俭明;王黎;;句处理中排歧问题补议[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国重要报纸全文数据库 前8条
1 记者 韩晓玲邋通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年
2 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年
3 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年
4 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年
5 刘萍;我国中文信息处理技术达到新水平[N];中国电子报;2001年
6 张海峰;我国软件产业发展的机遇和威胁[N];就业时报;2007年
7 胡唯元;文字编码新标准:不再为“名”所累[N];科技日报;2006年
8 ;浙江天宇信息技术有限公司[N];中国计算机报;2009年
中国博士学位论文全文数据库 前1条
1 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年
中国硕士学位论文全文数据库 前10条
1 罗丽俊;中文信息处理中若干技术的研究与实现[D];辽宁科技大学;2008年
2 任红梅;分词连写的中文信息处理[D];中国石油大学;2007年
3 朱冲;中文信息处理关键问题的研究[D];桂林电子科技大学;2009年
4 许婷;面向中文信息处理的复句特征分析器的研究与实现[D];华中师范大学;2011年
5 梁文娟;汉字语法语义智能输入法搭配库设计与实现[D];河南大学;2006年
6 刘剑锋;基于搭配关系的有标复句层次关系分析[D];华中师范大学;2015年
7 谢芳;特定领域术语的自动获取[D];华中师范大学;2006年
8 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年
9 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年
10 王振宇;基于Bootstrapping的交通工具名识别[D];山西大学;2009年
,本文编号:1287244
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1287244.html