当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于WEB的学科资源垂直搜索引擎的设计与实现

发布时间:2021-02-02 20:48
  随着Internet技术和应用的飞速发展,Web上的信息资源量正在快速增加。其中存在着大量的对教学和科研具有参考价值的学科资源,它们为学校的教学和科研带来了极大的便利。但是,通过像Google、Baidu等这样的通用搜索引擎在海量的、异构的网络信息资源中来检索某一具体学科资源时,往往不能快速准确的找到有价值的专业信息。垂直搜索引擎就正好满足了这种需求,它是面向某一个领域的专业搜索引擎,它可以为用户提供高质量的学科资源。本文以教育技术学学科资源为例。在对搜索引擎方法的研究分析和算法实现的基础上,提出了几点改进方法,并据此初步构建出了一个基于WEB的学科资源垂直搜索引擎的体系结构。然后按照该体系结构的设计,对其中较为重要的模块部分进行了详细的解释说明。并且在此基础上,通过运用扩展开源组件Lucene、 Heritrix以及本体和文本分类技术实现了该系统。其目的是帮助广大学科领域里的用户快速精准的查询学科领域资源。本文主要进行的工作如下:(1)研究垂直搜索引擎的相关理论,并对垂直搜索引擎的总体架构进行分析。(2)基于WEB的学科资源垂直搜索引擎系统的关键问题研究:构建学科资源本体,并将本体应... 

【文章来源】:华中师范大学湖北省 211工程院校 教育部直属院校

【文章页数】:73 页

【学位级别】:硕士

【文章目录】:
摘要
Abstract
1 绪论
    1.1 研究背景及意义
    1.2 研究现状
        1.2.1 学科资源导航库研究现状
        1.2.2 垂直搜索引擎研究现状
        1.2.3 存在的问题
    1.3 论文主要工作
    1.4 论文组织结构
2 垂直搜索引擎的相关理论概述
    2.1 搜索引擎的内涵
        2.1.1 搜索引擎是什么
        2.1.2 搜索引擎的分类
    2.2 垂直搜索引擎
        2.2.1 垂直搜索引擎的产生
        2.2.2 垂直搜索引擎系统总体架构
    2.3 垂直搜索引擎系统开发相关开源组件
        2.3.1 Lucene概述
        2.3.2 Heritrix介绍
    2.4 本章小结
3 基于WEB的学科资源垂直搜索引擎关键问题研究
    3.1 学科资源本体的概述与构建
        3.1.1 学科资源本体相关理论概述
        3.1.2 学科资源本体的构建
    3.2 文本分类
        3.2.1 文本分类概述
        3.2.2 文本分类的实现
    3.3 信息过滤
        3.3.1 信息过滤概述
        3.3.2 信息过滤的实现
    3.4 检索结果的可视化
        3.4.1 可视化及Jena概述
        3.4.2 检索结果可视化的实现
    3.5 本章小结
4 基于WEB的学科资源垂直搜索引擎的设计
    4.1 设计思路
    4.2 系统体系结构
    4.3 功能模块设计
        4.3.1 信息采集模块
        4.3.2 信息抽取模块
        4.3.3 文本分类模块
        4.3.4 索引模块
        4.3.5 检索模块
        4.3.6 信息过滤模块
    4.4 数据库设计
    4.5 本章小结
5 基于WEB的学科资源垂直搜索引擎的实现
    5.1 开发环境
    5.2 主要功能模块实现
        5.2.1 信息采集模块的实现
        5.2.2 信息抽取模块的实现
        5.2.3 索引模块的实现
        5.2.4 检索模块的实现
    5.3 系统测试与总结
        5.3.1 测试环境
        5.3.2 信息采集模块测试
        5.3.3 信息抽取模块测试
        5.3.4 索引模块测试
        5.3.5 检索模块测试
        5.3.6 系统总结与评价
    5.4 本章小结
6 总结与展望
    6.1 本文总结
    6.2 问题与展望
参考文献
论文项目资助、攻读学位期间参与项目
致谢


【参考文献】:
期刊论文
[1]农业高校图书馆重点学科资源导航库的构建及问题探讨——以东北农业大学农业学科资源导航系统为例[J]. 齐红,陶和林.  农业图书情报学刊. 2011(11)
[2]Heritrix在垂直搜索引擎中的应用[J]. 白万民,苏希乐.  计算机时代. 2011(09)
[3]面向主题的垂直搜索引擎系统的研究与实现[J]. 施佺,王恒山,肖仰华,丁卫平.  微电子学与计算机. 2011(07)
[4]基于DOM的动态网页信息抽取方法[J]. 王平根.  科技信息. 2010(31)
[5]垂直搜索引擎的研究与设计[J]. 刘运强.  计算机应用与软件. 2010(07)
[6]基于Lucene全文检索引擎的研究与实现[J]. 胡继钧.  科技创新导报. 2010(20)
[7]农业搜索引擎的发展现状及关键技术研究[J]. 彭玉容,杨捧,高媛.  安徽农业科学. 2010(20)
[8]基于分类的智能搜索引擎研究与实现[J]. 程传鹏.  中原工学院学报. 2010(03)
[9]基于语义查询扩展的垂直搜索研究[J]. 赵建伟,郑诚,吴永俊.  计算机工程. 2010(12)
[10]面向计算机教育资源的垂直搜索引擎系统的设计[J]. 李广丽,张红斌.  情报理论与实践. 2010(05)

博士论文
[1]文本分类及其相关技术研究[D]. 尚文倩.北京交通大学 2007

硕士论文
[1]基于领域本体的智能检索技术应用研究[D]. 宋庆.中国农业科学院 2011
[2]面向领域的垂直搜索引擎的研究与实现[D]. 邱伟林.大连海事大学 2011
[3]专家信息垂直搜索引擎关键技术研究与实现[D]. 刘邵斌.中南大学 2010
[4]数据挖掘可视化技术的研究与实现[D]. 郑宏.西安电子科技大学 2010
[5]中医临床诊疗垂直搜索系统研究[D]. 庄力.北京交通大学 2009
[6]基于Lucene的垂直搜索引擎关键技术的研究应用[D]. 刘朋.武汉理工大学 2009
[7]基于本体的交通导航数据语义查询研究[D]. 王庆连.大连海事大学 2009
[8]面向学科的基础教育资源垂直搜索引擎的研究与实现[D]. 翟晓玲.东北师范大学 2009
[9]基于本体的垂直搜索引擎研究[D]. 刘兴涛.山东大学 2009
[10]基于本体的垂直搜索系统的设计与实现[D]. 孔楠.北京交通大学 2008



本文编号:3015348

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/3015348.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户a3a9f***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com