当前位置:主页 > 社科论文 > 图书档案论文 >

NLP技术在中文全文信息处理中的应用研究

发布时间:2020-04-18 09:30
【摘要】: 论文以NLP(Natural Language Processing,自然语言处理)技术的发展现状为研究背景,系统全面地分析NLP技术在中文全文信息处理中的应用。 论文内容主要分为三大部分,第一部分主要介绍NLP技术的发展现状以及中文信息处理所涉及的几项关键技术。 第二部分主要从用户查询分析,信息源处理和检索匹配三个领域剖析NLP技术在中文全文信息处理中的应用情况,其中涉及几个关键的应用领域,主要是未登录词的识别、自动标引、自动文摘、文本分类以及概念检索等相关领域。 第三部分主要针对目前自然语言检索系统中存在的问题和不足,根据第二部分中介绍的NLP技术在信息检索系统中应用的三个领域,提出相应的优化检索效果的方法:1)构建正确理解用户查询需求的处理框架,提高检索系统对用户提问的理解程度;2)在信息源处理部分分析目前的自动标引的局限,建立一种通用的自动标引评价模型,并把基于机械匹配的分词方法和基于概率统计的分词方法结合起来改进自动标引的质量;3)针对检索匹配这一过程,引入概念控制的方法,建立一个基于概念控制的自然语言检索系统的理论模型,通过概念匹配来提高检索系统的质量。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:G354

【相似文献】

相关会议论文 前10条

1 章成志;周冬敏;苏新宁;;自动标引通用评价模型研究[A];2007年中国索引学会年会暨学术研讨会论文集[C];2007年

2 王兰成;;基于MM最小回溯和词义规则的知识标引研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年

3 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

4 张伟男;张宇;刘挺;;基于中心理论的中文对话省略恢复研究[A];第六届全国信息检索学术会议论文集[C];2010年

5 王佳;;对中文屋思想实验四个主要版本的考察[A];第三届全国科技哲学暨交叉学科研究生论坛文集[C];2010年

6 刘桐菊;于浩;赵铁军;;基于标引技术的特定领域XML文本自动生成[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

7 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年

8 王兰成;田梅;侯双;;PLS:一种基于信息自动标引的最小推进分词算法及其实现[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年

9 吴法洲;苏昊;周明;李春平;;利用英文搜索日志建立中文新词同义词词表[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

10 计峰;邱锡鹏;黄萱菁;;中文不确定性句子的识别研究[A];第六届全国信息检索学术会议论文集[C];2010年

相关重要报纸文章 前10条

1 记者 胡光耀;全美第二届中文大会开幕[N];人民日报海外版;2009年

2 泰国南美有限公司副总经理 陈美琪 整理 本报实习生 杨冰;泰国新一代学中文热潮到来[N];中国新闻出版报;2009年

3 记者 王建刚 吴志强;美国 中文电视举办20周年台庆[N];人民日报海外版;2010年

4 晓路;美国“中文热”遭遇教师荒[N];中国文化报;2011年

5 本报记者 韩言铭;中文在线 全媒体版权运营[N];中国经营报;2011年

6 本报驻外记者 吴乐s≌舉,

本文编号:2631950


资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2631950.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户8c08b***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com