当前位置:主页 > 社科论文 > 图书档案论文 >

基于本体的大型数据资源智能检索研究

发布时间:2020-04-22 07:31
【摘要】: 随着网络的发展,共享资源量越来越大,如何对这些资源进行系统的、科学的管理,并且能准确理解用户需求,从海量的信息中快速准确地找到所需内容成为数据共享中亟待解决的问题。 众所周知,当两个人在进行信息交流时,双方在认识问题的深度、考虑问题的着眼点等方面的差异往往会形成对同一问题的不同理解和认识,但由于公共知识的支持,交流并不会受到影响,一方可以共享另一方的专有知识,反之则亦然。目前人和计算机之间的交流还远远不能达到这样的程度,正是因为人与计算机之间的缺乏一种明确的并且计算机能够处理的公共知识支持机制,降低了人机之间信息共享的效率,也降低了数据共享的效率。 为了解决这些问题,国内外有关机构及专家纷纷开始研究基于本体论和智能代理的检索和知识管理系统,目的就是克服现有搜索引擎和信息管理方式的不足。本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,在信息检索领域得到了广泛的应用。通过建立领域本体库,包含有该领域的尽可能完备的知识。在领域本体库的支持下,很大程度上解决了多义词等语义问题。 本文围绕本体构建和基于领域本体的智能检索进行理论研究,主要工作和创新成果有以下几个方面: (1)领域本体模型的建立。本研究将以先进制造与自动化科学数据共享网的仪器仪表与检测技术领域整合的数据资源为基础,建立以数据提供者、数据内容和数据应用为主体的领域本体模型,为上层的数据分析和知识推理提供基础。 (2)开发相应的数据管理系统。本研究针对数据共享项目元数据格式对目前已经整理的数据资源进行分析,并通过JAVA编程,设计并构建一个基于本体的智能检索系统。有效的降低了用户检索误检率和漏检率。
【图文】:

项目体系,先进制造,科学数据


《先进制造与自动化科学数据共享网》项目体系图如下图4一2所示: iiiii机机 !!!!! 牵-----羹一一 {{{{{{自自械械 }}}}}馨 馨馨 {{{{{{{霆霆安安 !!!!!黔 黔黔黔 黔 黔 黔掣掣全全 {{{{{黔 黔黔孰 孰 孰 孰术术与与 !!!!!教 教教葬寒寒 寒 寒 寒可可 {{{{{沐 沐沐 沐 沐 沐 沐设设 {{{{{羹 羹羹 羹 羹 羹 羹计计 {{{{{爹 爹爹 爹 爹 爹 爹技技 {{{{{{象 象象 象 象 象 象术术 !!!!!母一少少少 少 少 少 少图4一2《先进制造与自动化科学数据共享网》项目体系图截至2007年5月底,已按照元数据标准和质量控制规范的要求整合、录入:数据集合元数据3523个数据对象元数据11212个数据对象10588个其中:数据表3232个,数据量约为224万个;图片2944张;PDF文件 1133个;HTML网页989个;Word文档2075个。

先进制造,科学数据,元数据,页面


内部标识符:100中文名称:项目编号中文全拼:xiang一mu一bian一hao定义:项目或课题正式立项之后的唯一标识代码。同义名称:项目正式编号数据类型:字符型数据格式:n二12关系:值域:计量单位:备注:4.2.3数据管理层数据管理层居于本系统的中央,主要是将用户层传送来的检索请求进行处理,,结合本体库和索引库,利用本体帮助检索信息系统更加有效的理解用户的
【学位授予单位】:合肥工业大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:G354;TP311.52

【引证文献】

相关期刊论文 前1条

1 曾新红;黄华军;林伟明;;超大型中文叙词表本体的检索与推理研究[J];现代图书情报技术;2010年Z1期

相关博士学位论文 前1条

1 谢琪;基于本体方法构建中医药概念信息模型的方法学示范研究[D];中国中医科学院;2011年



本文编号:2636306

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/2636306.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户cb35e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com