当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于Lucene的英汉跨语言信息检索

发布时间:2018-03-07 08:02

  本文选题:信息检索 切入点:跨语言信息检索 出处:《计算机工程》2005年13期  论文类型:期刊论文


【摘要】:描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检索性能的影响,基于Lucene全文索引工具包建立了搜索引擎。在系统评测方面,提出了一种根据主题,快速构建评测数据的方法。
[Abstract]:This paper describes the design and implementation of an English-Chinese cross-language retrieval system, the main purpose of which is to find a more effective method for English-Chinese query translation and to improve the performance of the Chinese retrieval system. On the basis of English-Chinese bilingual dictionaries, a query translation algorithm is established. In the aspect of Chinese retrieval, the influence of different index units on retrieval performance is analyzed, and a search engine based on Lucene full-text indexing toolkit is established. This paper presents a method to quickly construct the evaluation data according to the topic.
【作者单位】: 复旦大学计算机科学与工程系 复旦大学计算机科学与工程系
【基金】:国家自然科学基金资助项目(60203010)
【分类号】:TP391.3

【相似文献】

相关期刊论文 前10条

1 杨皓东;江凌;李国俊;;国内自然语言处理研究热点分析——基于共词分析[J];图书情报工作;2011年10期

2 史晓东;卢亚军;;央金藏文分词系统[J];中文信息学报;2011年04期

3 赵小兵;邱莉榕;赵铁军;;多民族语言本体知识库构建技术[J];中文信息学报;2011年04期

4 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期

5 安见才让;;藏语句子相似度算法的研究[J];中文信息学报;2011年04期

6 刘兴林;郑启伦;马千里;;中文合成词识别及分词修正[J];计算机应用研究;2011年08期

7 张海军;彭成;栾静;;基于外部排序的字串左右熵快速计算方法[J];计算机工程与应用;2011年19期

8 袁里驰;;基于词聚类的依存句法分析[J];中南大学学报(自然科学版);2011年07期

9 胡莉;;中文“词”的语言模型识别研究方法综述[J];北方文学(下半月);2011年03期

10 刘小明;樊孝忠;刘里;;融合事件信息的复杂问句分析方法[J];华南理工大学学报(自然科学版);2011年07期

相关会议论文 前10条

1 白刚;张铮;丁宗尧;朱毅;;中文文本聚类在互联网搜索的研究与应用[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 刘群;张浩;白硕;;中文信息处理开放平台的设计[A];第一届学生计算语言学研讨会论文集[C];2002年

3 支流;朱学锋;段慧明;俞士汶;;中文缩略语还原技术初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

4 郑家恒;谭红叶;王兴义;;基于模式匹配的中文专有名词识别[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

5 葛诗利;陈潇潇;;中国EFL学习者自动作文评分探索[A];第三届学生计算语言学研讨会论文集[C];2006年

6 宋柔;;自然语言处理中语言知识的基础性地位[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年

7 杨丽鹏;林世平;;基于关联规则和自然语言处理技术的概念间非分类关系的抽取[A];2008通信理论与技术新进展——第十三届全国青年通信学术会议论文集(上)[C];2008年

8 孙玉芳;;中文信息处理与国家信息化建设[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年

9 张sソ,

本文编号:1578572


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1578572.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户b067c***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com