智慧搜索引擎软件体系结构设计及其关键技术研究
发布时间:2021-12-30 18:46
大数据应用系统发展如火如荼,从互联网、物联网获取数据,提炼成信息或知识服务于各类用户。网页、感知数据集、数据集、各类结构化数据、语义数据的查询搜索是所有应用系统的一项基本功能,而爬取、抽取、索引是其中的关键功能。本文围绕以上几点进行了如下工作:1、提出了智慧搜索引擎的软件体系结构。借鉴传统搜索引擎模型的设计方法,分析智慧领域应用,确定领域边界、角色模型、业务模型、领域本体模型等,完成领域分析。在此基础上,完成实体构件、任务管理构件、实体管理构件、任务执行构件的设计。2、提出了基于本体的信息抽取方法。首先分析了各类网页数据的异同,针对各自的特点选择有针对性的方法进行网页信息的抽取。重点研究使用基于统计的方法抽取自由文本中的领域知识,扩充本体实例库。3、完成智慧搜索引擎原型系统的开发。以智慧安全领域为背景,利用已有的设计及数据资源,进行搜索引擎功能、界面的设计与实现。本文针对由互联网与物联网带来的海量数据,设计出能够满足智慧领域用户多种需求的搜索引擎软件体系结构,整合异构数据,提升搜索服务效果,支撑领域应用。
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
搜索引擎发展历史Archie可以看做是搜索引擎的祖先,它出现于1990年,McGill大学的学生
图 3-1 平台框架图图 3-1 定义了智慧搜索引擎的层次结构及各层之间交互情况。平台层次的划分,规定了各部分的功能任务,理清了平台各部分间的界限。同时,从资源开始自底向上的划分方式也展现了智慧搜索引擎从数据、信息、知识到最终支撑整个领域平台的研究与设计路线。本平台结构总体上共分为资源层、获取层、处理层、
图 3-2 数据流图如图 3-2 所示,本节将具体分析领域系统内的数据流。初始来源分为两种,一种是互联网的网页数据,一类是物联网的感知数据。经过爬取、抽取、本体实例扩充等环节的处理后,将数据转化为结构化数据并保存至相应的数据库中。整
【参考文献】:
期刊论文
[1]创新2.0视野下的智慧城市[J]. 宋刚,邬伦. 北京邮电大学学报(社会科学版). 2012(04)
[2]中文地名本体模型研究[J]. 蒋方玲,王文俊,杨鹏,徐佳佳. 计算机工程与应用. 2011(25)
[3]Ontology自动创建中实例学习的研究[J]. 刘贺欢,刘椿年. 计算机应用研究. 2006(03)
本文编号:3558773
【文章来源】:天津大学天津市 211工程院校 985工程院校 教育部直属院校
【文章页数】:74 页
【学位级别】:硕士
【部分图文】:
搜索引擎发展历史Archie可以看做是搜索引擎的祖先,它出现于1990年,McGill大学的学生
图 3-1 平台框架图图 3-1 定义了智慧搜索引擎的层次结构及各层之间交互情况。平台层次的划分,规定了各部分的功能任务,理清了平台各部分间的界限。同时,从资源开始自底向上的划分方式也展现了智慧搜索引擎从数据、信息、知识到最终支撑整个领域平台的研究与设计路线。本平台结构总体上共分为资源层、获取层、处理层、
图 3-2 数据流图如图 3-2 所示,本节将具体分析领域系统内的数据流。初始来源分为两种,一种是互联网的网页数据,一类是物联网的感知数据。经过爬取、抽取、本体实例扩充等环节的处理后,将数据转化为结构化数据并保存至相应的数据库中。整
【参考文献】:
期刊论文
[1]创新2.0视野下的智慧城市[J]. 宋刚,邬伦. 北京邮电大学学报(社会科学版). 2012(04)
[2]中文地名本体模型研究[J]. 蒋方玲,王文俊,杨鹏,徐佳佳. 计算机工程与应用. 2011(25)
[3]Ontology自动创建中实例学习的研究[J]. 刘贺欢,刘椿年. 计算机应用研究. 2006(03)
本文编号:3558773
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3558773.html