当前位置:主页 > 社科论文 > 图书档案论文 >

本体在信息检索中的应用及其进化机制研究

发布时间:2020-05-28 08:13
【摘要】: 近些年,随着信息技术的发展,网络资源数量呈爆炸式增长。然而,由于网页之间的相互引用产生了大量重复信息;大多数信息是半结构化和非结构化的,导致索引困难;尤其随着Web2.0时代的到来,每个人都可以在网络上发布信息,在没有任何约束的情况下,信息的质量难以保证,内容和格式也很难达到规范。网络的开放在给人们带来极大方便的同时,也造成了检索困难。 尽管传统信息检索系统不断改进,但是在复杂的网络环境下也越来越难满足用户的检索需求。笔者通过问卷调查、文献调研和亲自试验,发现目前信息检索系统还存在以下问题:搜索引擎返回结果太多,用户根本没有耐心逐页查看,大多数用户只看检索结果的前三页;搜索引擎的相关搜索和数据库的检索词扩展功能很少被利用,经笔者亲自试验也发现检索系统的扩展结果确实难如人意,系统提供的推荐词与检索词缺乏语义相关性;用户通常没有明确的检索目标,即使有也很难准确、全面地表达出来,人类语言普遍存在一词多义和一义多词现象,普通用户很难穷尽某个词的所有含义和某个含义的所有词汇,而目前的检索系统并没有为用户提供良好的检索词扩展和推荐功能。 作为网络信息资源与用户之间的重要桥梁,检索系统必须不断完善,提高查全率和查准率。既节约用户的时间与精力,又能提高信息资源的利用率。在整个信息检索过程中,用户输入的检索词至关重要,它直接决定检索结果,而普通用户的检索能力有限,所以智能化的检索系统应该能够对用户输入的检索词进行扩展和规范,为用户提供与检索词语义相关的推荐。 本体的出现为解决上述问题提供了契机,它是是共享的、概念化的、明确的、形式化的规范说明。它的目标是捕获领域内的共有知识,提供对该领域知识的共同理解,并从不同层次的形式化模型上给出这些概念及概念问相互关系的明确定义,实现领域知识推理,挖掘领域内隐含的知识。本体在信息检索领域已得到广泛应用,尤其在检索词扩展、信息抽取、文本分类及语义推理方面已取得一些进展,成为信息检索领域的研究热点。著名本体Wordnet已成为检索词扩展领域最受欢迎的本体资源之一,其能够产生更加全面和精确的检索结果。 为解决因网络信息资源自身特点、用户检索行为的局限性和检索系统的不足造成的检索困境,在借鉴和吸收国内外先进研究成果的基础上,本文提出了一个新的信息检索系统框架。它由用户接口模块、本体推理模块、本体管理模块、贝叶斯网络计算模块、检索匹配模块、数据库和索引文档模块组成。该系统利用本体强大的知识库和确定性推理能力,准确找出用户输入的检索词在本体概念图中的所有邻节点,完成检索词向领域内共享概念的转换,实现检索词扩展。利用贝叶斯网络的不确定性推理能力,计算检索词与所有邻节点的语义距离,将排序后的节点集提交检索匹配模块进行匹配查询,最终为用户返回的检索结果按照节点的排名顺序和节点与文档的相关程度进行排序,并将带有排名因素的概念集作为推荐反馈给用户。 传统的本体创建和维护都是在领域专家或知识工程师的指导下完成的,这就导致本体的创建和维护成本高昂、知识库更新缓慢、用户被完全隔离在本体进化过程之外,以致很难实现广泛的用户参与和知识共享。为此,本文发扬Web2.0思想,借鉴民俗分类的社区协作能力,利用Wiki技术,提出用户驱动的本体进化机制。该机制可以实现在动态开放的环境下让普通用户参与完善本体,每个参与者都能根据自己的需要组织知识、创建链接、自由编辑本体类、与社区内其他用户协商本体中概念的含义。这种开放的、协作式的本体进化方法能够明显改善本体维护过程,促进知识共享和流动。
【学位授予单位】:华东师范大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:G354

【参考文献】

相关期刊论文 前10条

1 宗南苏;何绮云;郑业鲁;钱平;;农业生产技术本体构建与语义检索实现[J];广东农业科学;2009年03期

2 赵庆龄,钱平,苏晓路,赵明;本体论在基于Web的土壤知识体系智能检索系统中的应用[J];计算机工程与应用;2005年05期

3 钟洪;夏利民;;基于本体的图像检索[J];计算机工程与应用;2007年17期

4 廖明宏;本体论与信息检索[J];计算机工程;2000年02期

5 徐德智;Paul Bakaki;赵于前;;用于离散数学知识检索的本体推理机的获取[J];计算技术与自动化;2009年01期

6 金芝;基于本体的需求自动获取[J];计算机学报;2000年05期

7 高军 ,王腾蛟 ,杨冬青 ,唐世渭;基于Ontology的Web内容二阶段半自动提取方法[J];计算机学报;2004年03期

8 李曼,王大治,杜小勇,王珊;基于领域本体的Web服务动态组合[J];计算机学报;2005年04期

9 赵涓涓;陈俊杰;刘嘉琳;许伟忠;;以本体为核心的图像情感语义检索模型[J];计算机应用;2009年05期

10 王卫东,王英林;基于本体的文档自动分类系统的研究[J];计算机仿真;2005年04期

相关博士学位论文 前1条

1 李景;本体理论及在农业文献检索系统中的应用研究——以花卉学本体建模为例[D];中国科学院研究生院(文献情报中心);2004年

相关硕士学位论文 前7条

1 李永喜;基于本体的智能信息检索研究[D];中国科学技术大学;2006年

2 郭嘉琦;领域本体的构建及其在信息检索中的应用研究[D];北京邮电大学;2007年

3 陈静;基于本体的信息抽取研究[D];苏州大学;2007年

4 李勤超;基于本体的地理信息检索方法研究[D];解放军信息工程大学;2007年

5 李丽;基于本体的网页文本分类的研究[D];北京交通大学;2008年

6 陈志伟;本体的构建及其在信息检索系统中的应用[D];华中师范大学;2008年

7 孔德冉;基于领域Ontology的Web信息抽取研究[D];东北师范大学;2009年



本文编号:2684965

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2684965.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户782e1***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com