当前位置:主页 > 科技论文 > 搜索引擎论文 >

一种改进的基于关系的信息检索技术

发布时间:2019-03-24 14:18
【摘要】:有研究工作表明现有的基于关系的信息检索技术(RIR)优于基于项(term)或基于语义(concept)的IR技术,但仍存在显而易见的缺陷,即不能明确关系本身,只能表达概念A,B是存在关系的概念对。本文提出一种改进的基于关系的IR技术—IRIR(Improved Relation-based Information Retrieval),就是要明确关系的取值和属性,整合概念对和关系的信息为三元组表达式(triple),通过以下匹配方法获取未知信息。对于文本中出现的知识表示为R(rela-tion)[First Concept,Second Concept],对于疑问代词(如what)开头的查询表达为R(relation)[First Concept,Un-known],对于疑问副词(如how)开头的查询表达为R(Unknown)[First Concept,Second Concept],当文本与查询的三元组表达式中已知部分匹配一致时,则得到查询未知部分的一个取值。由此,既可以实现类似QA(query answer)功能,又可以完成精确信息检索。基于Drexel大学DMBioinformatics Lab开发的生物医学文献搜索引擎(2004版,简称为RIRS),我们开发了一个能实现IRIR技术和功能的实验IR引擎—IRIRS(Improved Relation-Based IR Sys-tem),该系统使用UMLS和WordNet两大权威本体库分别确定概念和关系,在博士入学考试英语阅读理解测试集上的实验结果令人满意,IRIRS将文字段级别的检索精确度MA PP(Mean average passage precision)从RIRS的64.44%提高到74.28%。这表明,在IR中应用改进的基于关系的信息检索技术是非常具有探索价值的。
[Abstract]:Some studies have shown that the existing relational-based information retrieval technology (RIR) is superior to the item-based (term) or semantic-based (concept)-based IR technology, but there is still an obvious defect, that is, the relationship itself cannot be clearly defined, and only the concept A can be expressed. B is the concept pair of existential relations. In this paper, an improved relationship-based IR technique-IRIR (Improved Relation-based Information Retrieval), is proposed to clarify the values and attributes of the relationship, and to integrate the information of the concept pair and relation as a triple expression (triple),. The following matching methods are used to obtain unknown information. For the knowledge that appears in the text is represented as R (rela-tion) [First Concept,Second Concept], for a query beginning with a interrogative pronoun (such as what) expressed as R (relation) [First Concept,Un-known], For a query beginning with a query adverb (such as how) expressed as R (Unknown) [First Concept,Second Concept], a value of the unknown part of the query is obtained when the text matches the known part of the triplet expression of the query. As a result, it can not only realize QA (query answer)-like function, but also complete accurate information retrieval. Based on the biomedical literature search engine (version 2004, RIRS), for short) developed by DMBioinformatics Lab of Drexel University, we developed an experimental IR engine-IRIRS (Improved Relation-Based IR Sys-tem, which can realize the technology and function of IRIR. The system uses two authoritative libraries, UMLS and WordNet, to determine the concepts and relationships respectively. The experimental results are satisfactory on the English reading comprehension test set of the doctorate entrance examination. IRIRS increased the text-level retrieval accuracy MA PP (Mean average passage precision) from 64.44% of RIRS to 74.28%. This shows that the application of improved relationship-based information retrieval technology in IR is of great value for exploration.
【作者单位】: 国防科学技术大学计算机学院;北京航空航天大学计算机科学与工程学院;
【基金】:国家自然科学基金项目(60573057,60473057,90604007)的资助
【分类号】:TP391.3

【共引文献】

相关期刊论文 前10条

1 宋更宇;从文化视角看中国式英语[J];安徽技术师范学院学报;2005年03期

2 陈建珍;虚拟语气的论述及教学[J];北京工业职业技术学院学报;2003年01期

3 韩仲琪,李炳汝,王庆法;医学论文英文摘要格式及其写作问题[J];编辑学报;2002年06期

4 徐久芳;浅析英语表达中的“Chinglish”现象[J];福建商业高等专科学校学报;2005年04期

5 陈荣歆;语篇中逻辑联系语And的语料库研究及其对外语教学的启示[J];福建外语;2001年03期

6 丁桂英,肖珊美,杨晓东;论科技汉语句法结构之多维性[J];金华职业技术学院学报;2002年03期

7 吴永利;英语比较语法及其在法语二外教学中的应用[J];淮阴工学院学报;2001年04期

8 严明贵;语境中的词义猜测策略[J];齐齐哈尔大学学报(哲学社会科学版);2004年05期

9 方媛媛,王文斌;再论英语被动句之焦点[J];四川外语学院学报;2004年06期

10 孟志刚,熊前莉;当代英语被动句使用剖析[J];山东师大外国语学院学报;2001年04期

相关博士学位论文 前1条

1 许明武;科技英语句层信息传递功能研究[D];华中科技大学;2006年

相关硕士学位论文 前6条

1 邓飞;用语料库研究中国学生英文写作中连接副词的使用[D];华南师范大学;2003年

2 梁雪梅;英汉使役句对比[D];延边大学;2005年

3 孔艳;中国学生习得英语被动语态的偏误分析[D];中央民族大学;2006年

4 王燕;不定式从句—从普遍语法的角度对不定式的研究[D];上海外国语大学;2006年

5 杨爱玲;任务型教学模式在高中英语语法教学中的应用研究[D];西北师范大学;2007年

6 李菲;基于语料库的英语专业本科生毕业论文中连接副词使用情况的研究[D];南京农业大学;2007年

【相似文献】

相关期刊论文 前10条

1 周智佑;普利斯特(Prestel)──英国的可视数据系统[J];情报理论与实践;1988年06期

2 张晏青;;模糊信息检索[J];计算机研究与发展;1988年10期

3 喻名芝;;信息时代的情报检索教育[J];江汉大学学报(社会科学版);1991年05期

4 张崇祜;;建立文献检索课程新体系适应现代化要求[J];大学图书馆学报;1993年06期

5 史良;多媒体在科研档案管理中的应用[J];煤矿爆破;1994年04期

6 魏建华,曹青;信息科学发展现状与预防医学信息利用方法[J];预防医学文献信息;1995年02期

7 黄瑞敏;加强机检教学、深化教学改革[J];情报探索;1996年02期

8 曾民族;文本信息检索技术进展和性能评价框架[J];现代图书情报技术;1997年03期

9 ;市场竞争又添新助手《北京通》V2.0在京首发[J];电子出版;1997年12期

10 胡慧;互联网的信息检索技术[J];图书与情报;1998年03期

相关会议论文 前10条

1 宋今;黄河燕;陈肇雄;;面向网络实时翻译的双语信息管理系统BLIMS[A];1998年中国智能自动化学术会议论文集(下册)[C];1998年

2 施水才;肖诗斌;王弘蔚;王洪俊;苏东庄;;TRS中文文本信息检索技术的发展——从全文检索到基于自然语言处理的知识检索[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年

3 林水灿;;现代技术与传统方法交融下的信息检索技术[A];福建省社会科学信息工作年会网络时代文献信息的传统与现代学术研讨会论文集(1)[C];2003年

4 吴立德;黄萱菁;;前言[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

5 陈康;武港山;;基于Ontology的信息检索技术研究[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年

6 陆宇e,

本文编号:2446401


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2446401.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户e34fe***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com