当前位置:主页 > 科技论文 > 搜索引擎论文 >

中文信息处理研究工作的新进展

发布时间:2018-09-14 08:31
【摘要】:中文信息处理研究应以应用开发带动理论研究和技术研发。我国中文信息处理研究已在三个方面取得了重要进展:应用理论研究方面,语义的知识表示方法从句子扩展到了句群层面,构建了概念—语句—句群统一的知识表示模型;知识库资源建设方面,建立了达到应用规模的、包括概念知识库、语言知识库和言语知识库的多层次语义知识库资源;中文智能搜索引擎核心技术研发方面,实现了文本的语义分析和多层次的语义索引技术,以及基于语义理解的文本相似度计算技术,使用户可以用最自然的语言提出搜索请求,而不必受关键词的约束。基于语义的新一代中文搜索引擎即将出现大的突破。要提高我国中文信息处理的竞争力,应当重视具有自主知识产权的基于语义的理论和应用研究,加强人才队伍建设,进行科学组织和管理,促进以智能搜索技术发展及应用为主线的中文信息处理产业联盟的构建。
[Abstract]:Chinese information processing research should be driven by application development theory and technology research and development. The research of Chinese information processing in China has made important progress in three aspects: in the aspect of applied theory, semantic knowledge representation has been extended from sentence to sentence group level, and a unified knowledge representation model of concept-sentence-sentence group has been constructed; In the construction of knowledge base resources, the multi-level semantic knowledge base resources including concept knowledge base, language knowledge base and speech knowledge base are established, and the core technology of Chinese intelligent search engine is researched and developed. The text semantic analysis, multi-level semantic index technology and text similarity computing technology based on semantic understanding are implemented, which enables users to make search requests in the most natural language without the constraints of keywords. The new generation of Chinese search engine based on semantics is about to make a breakthrough. In order to improve the competitiveness of Chinese information processing in China, we should attach importance to semantic-based theoretical and applied research with independent intellectual property rights, strengthen the construction of the talent force, and carry out scientific organization and management. To promote the development and application of intelligent search technology as the main line of Chinese information processing industry alliance.
【作者单位】: 北京师范大学中文信息处理研究所;
【基金】:中文信息处理新进展是国家“十一五”科技支撑计划项目《中文信息处理应用研究与系统开发》(项目号2007BAH05B00)的研究成果
【分类号】:TP391.1

【共引文献】

相关期刊论文 前10条

1 史燕;程显毅;杨天明;陈海光;;知网、HNC和框架网的语义知识表示异同[J];广西师范大学学报(自然科学版);2009年01期

2 程显毅;潘燕;朱倩;孙萍;;面向事件的多文档文摘生成算法的研究[J];广西师范大学学报(自然科学版);2011年01期

3 郭晓航;;新型媒体——网络新闻的特点及管理策略探讨[J];中国传媒科技;2012年16期

4 郑炜冬;;多种方法融合的中文自动分词系统的设计与实现[J];韩山师范学院学报;2009年06期

5 张运良;张全;;服务于句类分析系统的微型语言专家系统建设[J];计算机工程与应用;2006年23期

6 韦向峰;缪建明;张全;;汉语句群领域的自动抽取研究[J];计算机工程与应用;2009年04期

7 张运良;朱礼军;乔晓东;张全;;基于句类特征的作者写作风格分类研究[J];计算机工程与应用;2009年22期

8 梁娜;耿国华;周明全;;自然语言处理中的语义关系与句法模式互发现[J];计算机应用研究;2008年08期

9 吴勇;周军;;基于语境和语义的中文文本聚类算法研究[J];科技信息;2010年35期

10 王青海;马海慧;池毓焕;李颖;董凌冲;;基于HNC的汉语词语知识库改进[J];中文信息学报;2012年02期

相关会议论文 前6条

1 王青海;马海慧;池毓焕;李颖;董凌冲;;基于HNC的汉语词语知识库改进[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

2 王敬成;;HNC农村智能信息检索系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年

3 覃张华;王景中;;基于语境框架的倾向性文本过滤算法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年

4 张运良;;“不是”的用法及自动处理研究[A];第三届学生计算语言学研讨会论文集[C];2006年

5 郭庆军;赵燕平;;一种简单的基于奖励机制的文本分类算法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

6 缪建明;张全;;HNC句群处理研究新进展[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年

相关博士学位论文 前1条

1 姜欣;古茶诗的跨语际符号转换与机辅翻译研究[D];大连理工大学;2010年

相关硕士学位论文 前10条

1 孙萍;面向事件的多文档自动文摘研究[D];江苏大学;2010年

2 石凯华;基于领域词典的汉语语块分析的研究[D];南京邮电大学;2011年

3 吴静;网络舆情信息采集系统的设计与实现[D];电子科技大学;2011年

4 李伟;现代汉语句型自动识别的研究[D];厦门大学;2007年

5 覃张华;短文本语义过滤技术的研究[D];北方工业大学;2008年

6 郭庆贺;中文文本姓名识别的研究[D];东北师范大学;2009年

7 魏巍;ToIIS中情报信息服务描述和匹配技术研究[D];国防科学技术大学;2009年

8 史燕;基于HNC的汉语句子相似度算法的研究[D];江苏大学;2009年

9 张涛;基于HNC理论的句子语义分析[D];北京理工大学;2010年

10 刘丁;隐喻的形式化模型研究[D];长安大学;2010年

【相似文献】

相关期刊论文 前10条

1 陈明远,管汀鹭;打字能比说话更快——几种高速键盘的设计[J];自然杂志;1980年08期

2 唐亚伟;亚伟中文速录机的诞生与应用[J];中文信息;1994年05期

3 胡宜课;信息高速公路与中文信息处理技术[J];计算机工程;1996年S1期

4 张俊林;曲为民;杜林;孙玉芳;;跨语言信息检索研究进展[J];计算机科学;2004年07期

5 罗燕;中文信息检索系统中的自然语言理解技术研究[J];图书情报工作;2005年04期

6 谢谦;芮建武;吴健;;编码字符集标准及分类研究[J];中文信息学报;2006年05期

7 陈丹;李宁;李亮;;古文字的联机手写识别研究[J];北京机械工业学院学报;2008年04期

8 林浩;韩冰;杨乐华;;一种基于改进最大匹配快速中文分词算法[J];科技创新导报;2009年09期

9 吴新年;数字图书馆技术之进展[J];图书与情报;2000年02期

10 高定国,龚育昌;现代藏字全集的属性统计研究[J];中文信息学报;2005年01期

相关会议论文 前10条

1 周洪仁;;简论逻辑的应用理论研究[A];逻辑今探——中国逻辑学会第五次代表大会暨学术讨论会论文集[C];1996年

2 ;中国中文信息学会交流材料[A];2011年网络学术交流研讨会交流材料[C];2011年

3 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

4 陈文亮;朱靖波;吕学强;姚天顺;;词性标注规则的获取和优化[A];第一届学生计算语言学研讨会论文集[C];2002年

5 ;前言[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年

6 刘春荣;;我国当务之急是解决中文书写方式的根本变革[A];中国中文信息学会汉字编码专业委员会第九届年会暨学术研讨会论文集[C];2011年

7 李毅;亢世勇;孙茂松;孙道功;;基于奥运语料的语义成分标注规范[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

8 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年

9 莫锦贤;马常楼;;文本文件转换成语音文件及其合成输出[A];第二届全国人机语音通讯学术会议论文集[C];1992年

10 乐明;冯志伟;;篇章修辞结构树库概述[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

相关重要报纸文章 前10条

1 记者 梁捷;我国中文信息处理技术从实验室走向全面应用[N];光明日报;2009年

2 高秀用 军事科学院军事百科研究所研究员;适应新军事变革需要 深化军制应用理论研究[N];中国社会科学报;2010年

3 姚双云 华中师范大学语言与语言教育研究中心;虚词知识库:中文信息处理的基石[N];中国社会科学报;2011年

4 倪光南;活力重现的中文信息处理[N];计算机世界;2001年

5 齐悦;速记界泰斗唐亚伟 获中文信息处理领域最高科技奖[N];中国质量报;2006年

6 张波 龙雨;中文信息处理国际学术会议在武汉大学召开[N];中国社会科学院院报;2007年

7 记者 段佳;中文信息处理技术加速前行[N];大众科技报;2009年

8 记者 韩晓玲邋通讯员 张波 龙雨;海内外专家聚焦中文信息处理[N];湖北日报;2007年

9 本报记者 毛国兵 通讯员 岚宇;亚伟速录:实现中文信息处理产业化的自主品牌[N];中国贸易报;2008年

10 本报记者 关逸民;中文速录成为自主核心技术产业[N];中国信息报;2006年

相关博士学位论文 前10条

1 宋春阳;面向信息处理的现代汉语“名+名”逻辑语义研究[D];上海师范大学;2003年

2 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年

3 周卫华;面向中文信息处理的现代汉语动宾语义搭配研究[D];华中师范大学;2007年

4 詹卫东;面向中文信息处理的现代汉语短语结构规则研究[D];北京大学;1999年

5 李琼;汉语复句书读前后语言片段的非分句识别[D];华中师范大学;2008年

6 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年

7 王建会;中文信息处理中若干关键技术的研究[D];复旦大学;2004年

8 吕艳辉;基于语料库的现代汉语手部动词研究[D];山东大学;2008年

9 陈慧;基于DCC动态流通语料库的中文组织名考察与研究[D];北京语言大学;2008年

10 吴应良;网络计算中的智能信息处理方法研究[D];华南理工大学;2000年

相关硕士学位论文 前10条

1 陶东成;基于Linux和XIM协议的中文输入法服务器的实现及其应用[D];苏州大学;2004年

2 罗忠毅;数字化中医古籍的理想模式及其相关问题研究[D];成都中医药大学;2005年

3 王敏;基于改进的隐马尔科夫模型汉语词性标注[D];山西大学;2007年

4 党兰学;汉字语法语义智能输入法总体设计与部分实现[D];河南大学;2006年

5 傅成宏;现代汉语兼语结构的自动识别[D];南京师范大学;2007年

6 白晓梅;校园网中文搜索引掣系统的设计与实现[D];吉林大学;2006年

7 曹林峰;中文文字差错率统计软件的实现[D];西安电子科技大学;2007年

8 刘桂梅;周有光语文改革思想研究[D];山东师范大学;2005年

9 张玉华;基于码本的输入法评测系统的设计和实现[D];苏州大学;2005年

10 杜莹;汉字语法语义智能输入法核心算法及实现技术[D];河南大学;2006年



本文编号:2242142

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2242142.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e56d8***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com