当前位置:主页 > 科技论文 > 搜索引擎论文 >

汉语文本中交集型切分歧义的分类处理

发布时间:2018-02-10 09:33

  本文关键词: 自动分词 交集型歧义字段 宏结构 类别 出处:《小型微型计算机系统》2004年08期  论文类型:期刊论文


【摘要】:自动分词是中文信息处理的基本问题 ,交集型歧义字段的切分又是中文分词的难点 .本文把交集型歧义字段按其宏结构分类 ,再依据本文提出的 4条切分原则 ,使用歧义字段的结构信息和语法规则对不同类型的交集字段分别处理 ,提高了分词的准确性 .该分词方法已作为中文网页索引和检索工具被用于网络搜索引擎中 .实验效果表明 ,这一分词系统能够处理某些其它分词系统不能正确划分的实例
[Abstract]:Automatic word segmentation is the basic problem of Chinese information processing, and the segmentation of overlapping ambiguous fields is also the difficulty of Chinese word segmentation. In this paper, the overlapping ambiguous fields are classified according to their macro structure, and then according to the four segmentation principles proposed in this paper, The structure information and syntax rules of ambiguous fields are used to deal with different types of intersection fields, The segmentation method has been used as a Chinese web page index and retrieval tool in the web search engine. The experimental results show that the segmentation system can handle some examples of other word segmentation systems that can not be partitioned correctly.
【作者单位】: 吉林大学计算机科学与技术学院 吉林大学计算机科学与技术学院 吉林大学计算机科学与技术学院
【基金】:国家自然科学基金 (69673 0 15 ,60 3 73 0 99)资助 吉林省科技发展计划项目 (合同号 :2 0 0 0 0111)资助
【分类号】:TP391.1

【参考文献】

相关期刊论文 前6条

1 林亚平,李彦,童调生,尹锋;汉语自动分词中的神经网络技术研究[J];湖南大学学报(自然科学版);1997年06期

2 殷建平;汉语自动分词方法[J];计算机工程与科学;1998年03期

3 韩客松,王永成,陈桂林;汉语语言的无词典分词模型系统[J];计算机应用研究;1999年10期

4 梁南元;书面汉语自动分词系统—CDWS[J];中文信息学报;1987年02期

5 尹锋;基于神经网络的汉语自动分词系统的设计与分析[J];情报学报;1998年01期

6 李家福,张亚非;一种基于概率模型的分词系统[J];系统仿真学报;2002年05期

【共引文献】

相关期刊论文 前10条

1 杜道流;指称、陈述理论及其对上古语法研究的意义[J];安徽大学学报;2004年01期

2 姜红;;具体名词和抽象名词的不对称现象[J];安徽大学学报(哲学社会科学版);2009年02期

3 施发笔;试论《水浒传》介词避复的技巧[J];安徽教育学院学报;2002年04期

4 阮绪和;形名偏正结构的语法功能[J];安徽教育学院学报;2003年02期

5 陶振伟;;“拿”的语法化[J];安徽教育学院学报;2006年04期

6 樊友新;;从“被就业”看“被”的语用功能[J];合肥师范学院学报;2010年02期

7 冯鸣;英语表持续时段的for短语和汉语时量词语的比较[J];安徽广播电视大学学报;2001年02期

8 王有卫;;语素文字说质疑[J];安徽广播电视大学学报;2010年03期

9 柳国栋;;《论语》重叠词略论[J];安徽职业技术学院学报;2008年02期

10 王葆华;同动式论略[J];安徽师范大学学报(人文社会科学版);1999年03期

相关会议论文 前10条

1 李影;付莉;;韩国中小学生“是”的错序偏误分析[A];语言与文化研究(第四辑)[C];2009年

2 沈焕生;朱磊;;基于信息内容的关键词抽取研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年

3 吕晓玲;;闽南方言南安话的类结构助词“得”、“说”、“伊”、“通”[A];福建省辞书学会第五届会员代表大会暨第十九届年会论文集[C];2009年

4 田长生;;浅谈《论语》中的复叠现象[A];江西省语言学会2005年年会论文集[C];2005年

5 阮绪和;;江西武宁(上汤)话的程度副词“死、几、蛮”[A];江西省语言学会2005年年会论文集[C];2005年

6 魏亮珍;;浅析《吕梁英雄传》中的“给”[A];江西省语言学会2006年年会论文集[C];2006年

7 周小婕;;数词研究综述[A];江西省语言学会2006年年会论文集[C];2006年

8 王安琛;;试论“V—V”结构[A];江西省语言学会2006年年会论文集[C];2006年

9 王安琛;;重叠式动补短语的句法语义分析[A];江西省语言学会2006年年会论文集[C];2006年

10 陈星;;汉英定语语序的对比分析及其相关问题研究[A];江西省语言学会2008年年会论文集[C];2008年

相关博士学位论文 前10条

1 陈佳;论英汉运动事件表达中“路径”单位的“空间界态”概念语义及其句法—语义接口功能[D];上海外国语大学;2010年

2 杨先明;0-5岁汉语儿童语言发展的认知研究[D];武汉大学;2010年

3 吴云霞;万荣方言语法研究[D];厦门大学;2002年

4 王志军;英汉被动句认知对比研究[D];复旦大学;2003年

5 王强军;基于动态流通语料库(DCC)的信息技术领域新术语自动提取研究[D];北京语言文化大学;2003年

6 徐默凡;现代汉语工具范畴的认知研究[D];华东师范大学;2003年

7 姜玲;英汉隐喻句对比研究英汉隐喻句对比研究[D];河南大学;2003年

8 聂仁发;现代汉语语篇研究[D];湖南师范大学;2002年

9 樊中元;现代汉语一名多量现象研究[D];湖南师范大学;2003年

10 延俊荣;给予句研究[D];复旦大学;2003年

相关硕士学位论文 前10条

1 黄雪;俄汉语词汇理据性对比研究[D];哈尔滨师范大学;2010年

2 马晶晶;表人名词类词缀“X手”、“X者”、“X员”分析比较[D];辽宁师范大学;2010年

3 乌晓丽;“X+—N比—N+VP”表义功能新探[D];辽宁师范大学;2010年

4 刘婧一;元代笔记分词理论与实践[D];广西师范学院;2010年

5 旷金辉;汉英名词前置修饰语语序对比研究[D];上海外国语大学;2010年

6 陶胜妃;现代汉语谓词修饰词前后位置比较研究[D];上海外国语大学;2010年

7 严伟剑;疑问代词“怎么”“怎样”“怎么样”对比研究[D];上海外国语大学;2010年

8 耿冰;“实现事件”结构词汇化模式的英汉对比研究[D];上海外国语大学;2010年

9 王冰;《红楼梦》中茶”相关行为映射译者风格研究[D];大连理工大学;2010年

10 姜丹丹;面向对外汉语教学的插入语研究[D];辽宁师范大学;2010年

【二级参考文献】

相关期刊论文 前5条

1 李国臣,刘开瑛,张永奎;汉语自动分词及歧义组合结构的处理[J];中文信息学报;1988年03期

2 何克抗,徐辉,孙波;书面汉语自动分词专家系统设计原理[J];中文信息学报;1991年02期

3 韩世欣,王开铸;基于短语结构文法的分词研究[J];中文信息学报;1992年03期

4 徐秉铮,詹剑,贺前华;基于神经网络的分词方法[J];中文信息学报;1993年02期

5 尹锋,林亚平;汉语自动分词技术的现状及发展趋势[J];软件世界;1996年12期

【相似文献】

相关期刊论文 前10条

1 孙建奇,李东亚,于海泓;黄河信息资源分析[J];人民黄河;2002年05期

2 张爱华,李维君;新型的数据库管理软件——Visual FoxPro[J];山西科技;1998年04期

3 柳雪涛,黄志球,左银龙,高鹏;数据仓库系统中用户驱动报表工具的设计与实现[J];小型微型计算机系统;2002年02期

4 张根华;浅谈古籍版本的鉴定[J];三明高等专科学校学报;1999年S2期

5 张子侠;论史志目录的类别及其特点[J];安徽大学学报(哲学社会科学版);2003年05期

6 刘新民;清代《说文解字》的论著研究[J];图书情报工作;2002年02期

7 褚东帆;多媒体通信技术概述[J];治淮;2003年11期

8 刘江;UL认证漫谈(四)[J];电子质量;1995年05期

9 刘蔚铭;英文法律术语的类别与译名实例解析[J];术语标准化与信息技术;2003年03期

10 曹雪琦;;高等院校的信息用户及其需求特征[J];中国科教创新导刊;2008年19期

相关会议论文 前10条

1 常建芳;莫雷;侯杰泰;;类别特征相似性与竞争性对推理的影响[A];第十二届全国心理学学术大会论文摘要集[C];2009年

2 周艳;李伍荣;;基于服务类型的服务国际化方式选择[A];第三届(2008)中国管理学年会论文集[C];2008年

3 江耘;;香港电视新闻之特点分析[A];信息化进程中的传媒教育与传媒研究——第二届中国传播学论坛论文汇编(上册)[C];2002年

4 骆术斌;;吉林省江河水质评价[A];中国水利学会第二届青年科技论坛论文集[C];2005年

5 黄艳丽;;农村留守学生教育存在的问题及教育对策[A];国家教师科研基金十一五阶段性成果集(湖北卷)[C];2010年

6 赵冬梅;刘志雅;;类别研究的理论观[A];第十届全国心理学学术大会论文摘要集[C];2005年

7 刘凤英;;类别因果关系对基于类别的特征推理任务的影响研究[A];第十一届全国心理学学术会议论文摘要集[C];2007年

8 张珂;;跨文化交际学理论基础:Harry Triandis主观文化理论框架[A];第六届中国跨文化交际研究会年会论文摘要汇编[C];2005年

9 姚树俊;康萍;蒋梦莉;张晓瑞;;知识类别在知识转移中的应用研究[A];第十二届中国青年信息与管理学者大会论文集[C];2010年

10 ;征集项目一览表[A];2010’第五届绿色财富(中国)论坛会刊[C];2010年

相关重要报纸文章 前10条

1 记者 顾威;沈阳重新设置建筑企业资质类别[N];工人日报;2000年

2 ;攀岩的类别[N];信息时报;2002年

3 记者 方天;50家市场半年交易410亿[N];扬州日报;2011年

4 陆龙生;对欧盟纺织品配额招标类别市场分析[N];中国纺织报;2001年

5 栋;类别管理:大社大店的营销合作[N];中国图书商报;2002年

6 ;免检产品类别目录[N];中国质量报;2002年

7 肖丹 陈兰琴 念红梅 陈正红;全球“最佳中之最佳”BtoB网站[N];国际经贸消息;2000年

8 叶星生;藏式传统家具类别[N];西藏日报;2001年

9 本报记者 王超;专家呼吁 评价类别靠前公司可获更多政策优惠[N];中国证券报;2011年

10 记者 于普增 王辉;免检产品又添新丁[N];中国质量报;2001年

相关博士学位论文 前10条

1 龙长权;类别对归纳的支持与限制[D];西南大学;2011年

2 武恩义;英汉典故对比研究[D];中央民族大学;2006年

3 段运冬;电影,,作为隐喻的艺术[D];中国艺术研究院;2009年

4 陈曦;特征选择准则间的关联及高分辨率遥感影像类别不平衡问题研究[D];上海交通大学;2011年

5 白红民;类别特异性命名区的脑定位及其临床应用研究[D];第二军医大学;2010年

6 仝宇光;英语一义多词学习中的提取诱发作用研究[D];辽宁师范大学;2011年

7 陆福相;基于内容的场景和物体类别识别研究[D];上海交通大学;2011年

8 祝翠玲;基于类别结构的文本层次分类方法研究[D];山东大学;2011年

9 李欣;复杂背景下红外弱小目标检测算法研究[D];西安电子科技大学;2010年

10 李小宁;药品监管的多元参与:科学计量学的视角[D];大连理工大学;2010年

相关硕士学位论文 前10条

1 李伟霞;类别特征早期加工的脑机制研究[D];西南大学;2012年

2 程兵;两汉骚体赋研究[D];安徽大学;2005年

3 唐丽;名词句的形成、发展及因由研究[D];广西大学;2007年

4 刘爽;外观设计专利保护范围和侵权判定[D];内蒙古大学;2006年

5 王娟;汉语体育新闻评论中互文性的类别和功能[D];华中师范大学;2008年

6 王丽;《说文解字》农耕词研究[D];西南师范大学;2005年

7 高贺囡;俄语口语称名研究[D];东北师范大学;2006年

8 杨生柱;农村小学教育成本构成研究[D];内蒙古师范大学;2007年

9 马庆娟;恩施州土家族传统体育项目类别、流变特征及发展对策研究[D];武汉体育学院;2009年

10 唐芳;论俄语同音异义词[D];华中师范大学;2009年



本文编号:1500209

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1500209.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户d41cb***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com