对中文分词歧义消除算法的研究
本文关键词:对中文分词歧义消除算法的研究
【摘要】:介绍中文分词算法的理论知识,通过介绍歧义存在的种类,分析分词结果出现歧义的必然性.提出改进"退一字组合法",实现歧义消除.在保持切分速度的前提下,提高切分的精度.为搜索引擎建立索引奠定良好的基础.
【作者单位】: 苏州工业园区服务外包职业学院移动互联网技术系;
【关键词】: 中文分词 歧义消除 歧义处理 歧义字段
【分类号】:TP391.1
【正文快照】: 中文分词是指将中文文本拆分成词的技术.目前,中文分词技术已经广泛应用于信息检索、搜索引擎、信息抽取、机器翻译、汉字的智能化输入、中外文对译、中文校对、自动摘要、自动分类、文本的语音输入等很多方面和领域,中文分词技术是中文信息处理中的关键技术之一,分词的速度和
【参考文献】
中国期刊全文数据库 前1条
1 孙茂松,左正平,黄昌宁;汉语自动分词词典机制的实验研究[J];中文信息学报;2000年01期
【共引文献】
中国期刊全文数据库 前10条
1 高艳萍;于红;尹祥贵;綦孝姬;王春永;赵志强;;基于双数组Trie树的渔业领域分词研究[J];安徽农业科学;2008年11期
2 胡锡衡;;正向最大匹配法在中文分词技术中的应用[J];鞍山师范学院学报;2008年02期
3 胡顺义;赵晓凡;;基于PB的汉语电子词典管理系统设计与实现[J];安阳师范学院学报;2010年05期
4 马志强;周长胜;丁维;杨娜;;校园网搜索引擎的研究与实现[J];北京机械工业学院学报;2007年01期
5 张霄军;陈小荷;;面向世博语言信息处理的汉英机器词典[J];辞书研究;2007年04期
6 赵春红;高希龙;王柠;赵威;刘国华;;一种应用分治策略的中文分词方法[J];燕山大学学报;2009年05期
7 顾海峰;;基于中文TTS技术研究[J];电脑知识与技术(学术交流);2007年09期
8 郭屹;;对中文自动分词机制的研究和改进[J];电脑知识与技术;2008年07期
9 杨宇;林锦国;巫振新;;自动化专业多引擎机器翻译研究[J];电脑知识与技术;2008年25期
10 方春平;管建和;;基于多重数组的词典技术研究与实现[J];电脑知识与技术;2009年09期
中国重要会议论文全文数据库 前8条
1 吴晶晶;荆继武;王平建;;一种基于词典的新型中文分词机制[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
2 李江波;周强;陈祖舜;;汉语词典快速查询算法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年
3 杨超;李仁发;蒋斌;;一种高效的汉语自动分词词典机制[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 李江波;周强;陈祖舜;;汉语词典的快速查询算法研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
5 朱鉴;张建;李淼;强静;杨攀;;面向民族语言信息处理的汉语分词方法[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
6 孙宏纲;陆余良;;基于二元切分的互联网新闻主题词自动提取研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
7 孙雄勇;罗霄;;中图分类法体系下的自动分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 柏文阳;何瑗;马耀华;肖建华;徐洁磐;;基于消息的汇率趋势预测方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
中国博士学位论文全文数据库 前9条
1 李庆虎;基于P2P架构的网格文件系统研究[D];清华大学;2004年
2 李晓光;XML非完全结构查询处理中若干关键技术的研究[D];东北大学;2006年
3 张春霞;领域文本知识获取方法研究及其在考古领域中的应用[D];中国科学院研究生院(计算技术研究所);2005年
4 陈博;WEB文本情感分类中关键问题的研究[D];北京邮电大学;2008年
5 姜欣;古茶诗的跨语际符号转换与机辅翻译研究[D];大连理工大学;2010年
6 王龙;教育资源推荐服务中若干关键技术的研究[D];吉林大学;2013年
7 黄建年;农业古籍的计算机断句标点与分词标引研究[D];南京农业大学;2009年
8 汲业;面向图像的垂直搜索引擎关键技术研究[D];大连海事大学;2013年
9 陆前;英、汉跨语言话题检测与跟踪技术研究[D];中央民族大学;2013年
中国硕士学位论文全文数据库 前10条
1 甄涛;基于社团发现的Blog信息收集原型系统的研究[D];解放军信息工程大学;2009年
2 蔡蕊;一种新的搜索引擎分词词典的研究[D];山东大学;2010年
3 陈可钦;基于垂直搜索引擎的主题爬虫算法的研究[D];中南林业科技大学;2009年
4 曹亚辉;非结构文本最佳近似匹配系统的研究与实现[D];东华大学;2011年
5 陈磊;用例图到顺序图转换的研究[D];西安电子科技大学;2009年
6 兰冲;基于统计规则的中文分词研究[D];西安电子科技大学;2011年
7 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
8 曹仲伟;FTP搜索引擎的关键技术研究[D];湖北工业大学;2011年
9 蒋才智;中文自动分词及人名识别技术研究[D];合肥工业大学;2011年
10 王\~;基于Lucene的同义词扩展检索的研究与实现[D];天津财经大学;2011年
【二级参考文献】
中国期刊全文数据库 前2条
1 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期
2 孙茂松,邹嘉彦;汉语自动分词研究中的苦干理论问题[J];语言文字应用;1995年04期
【相似文献】
中国期刊全文数据库 前10条
1 张博;姜建国;万平国;;对互联网环境下中文分词系统的一种架构改进[J];计算机应用研究;2006年11期
2 夏新松;肖建国;;一种新的错误驱动学习方法在中文分词中的应用[J];计算机科学;2006年03期
3 周军;王艳红;;一种基于词典的中文分词法的设计与实现[J];黑龙江科技信息;2008年25期
4 许高建;胡学钢;路遥;王庆人;;一种改进的中文分词歧义消除算法研究[J];合肥工业大学学报(自然科学版);2008年10期
5 张培颖;;运用有向图进行中文分词研究[J];计算机工程与应用;2009年22期
6 吴晶晶;荆继武;聂晓峰;王平建;;一种快速中文分词词典机制[J];中国科学院研究生院学报;2009年05期
7 许华;;中文分词系统设计之词典构造[J];科技创新导报;2010年20期
8 韩月阳;邓世昆;贾时银;李远方;;基于字分类的中文分词的研究[J];计算机技术与发展;2011年07期
9 莫建文;郑阳;首照宇;张顺岚;;改进的基于词典的中文分词方法[J];计算机工程与设计;2013年05期
10 李庆虎,陈玉健,孙家广;一种中文分词词典新机制——双字哈希机制[J];中文信息学报;2003年04期
中国重要会议论文全文数据库 前10条
1 王敏;叶宽余;薛峰;;一种面向网店商品搜索的中文分词系统设计[A];全国第22届计算机技术与应用学术会议(CACIS·2011)暨全国第3届安全关键技术与应用(SCA·2011)学术会议论文摘要集[C];2011年
2 黄昌宁;赵海;;由字构词——中文分词新方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 任飞亮;石磊;姚天顺;;应用支持向量机进行中文分词[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 吴晶晶;荆继武;王平建;;一种基于词典的新型中文分词机制[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
5 李玉梅;靳光瑾;黄昌宁;;中文分词规范中的歧义字段消解细则[A];第五届全国语言文字应用学术研讨会论文集[C];2007年
6 修驰;宋柔;;基于“大词”实例的中文分词研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 黄居仁;;瓶颈,挑战,与转机:中文分词研究的新思维[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
8 李寿山;黄居仁;;基于词边界分类的中文分词方法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
9 张梅山;邓知龙;车万翔;刘挺;;统计与词典相结合的领域自适应中文分词[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
10 王屹林;朱慕华;朱靖波;;针对SVM中文分词特性的个性化后处理设计[A];第三届学生计算语言学研讨会论文集[C];2006年
中国硕士学位论文全文数据库 前10条
1 王荔;统计全切分中文分词系统的研究与实现[D];西安电子科技大学;2009年
2 黄翼彪;开源中文分词器的比较研究[D];郑州大学;2013年
3 许华婷;基于Active Learning的中文分词领域自适应方法的研究[D];北京交通大学;2015年
4 曹卫峰;中文分词关键技术研究[D];南京理工大学;2009年
5 许顺;中文分词规范可计算化的研究与实现[D];苏州大学;2006年
6 魏博诚;中文分词交集型歧义处理研究[D];安徽大学;2011年
7 代聪;基于英汉平行语料的中文分词研究与应用[D];大连理工大学;2012年
8 顾辉;基于中文分词的购物中心微信平台购物导航的设计与实现[D];华中师范大学;2015年
9 王为磊;基于多目标优化的中文分词模型的研究[D];苏州大学;2008年
10 佟德琴;基于字词联合解码的中文分词研究[D];大连理工大学;2011年
,本文编号:777939
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/777939.html