当前位置:主页 > 社科论文 > 图书档案论文 >

一个基于WEB的信息组织与检索模型(WIORS)研究

发布时间:2023-10-06 17:59
  Internet作为一种现象,本质可以用三个词来表示,就是搜索、发现、获得。在新的网络信息环境下,不但信息的存储和获取渠道发生了变化,人们对信息的存取的思维和方式也产生了改变。在网络环境中,越来越多传统的信息资源正在向网上转移,网络上的信息空间正在急剧膨胀。如何对不断膨胀的网络信息资源进行组织与检索,是一个急需解决的难题。 短短几年的时间内,搜索引擎成为了我们日常生活中的一部分。搜索引擎因其强大的功能和简单的操作,成为了网络信息资源组织和检索中最常用、最基本的工具。然而,搜索引擎的作用也是有限的,由于各种原因,互联网有一半以上的信息资源搜索引擎访问不到,这部分资源我们称之为看不见的信息资源。所以,从看不见的信息资源的角度作为切入点,研究对这部分信息资源的组织和检索方法,对网络信息资源的组织与检索具有深远的意义。 本文从网络信息资源的现状入手,系统地、深入的分析了现阶段信息资源的分布特点,以及其组织的模式,提出了一个基于Web的信息组织与检索的模型,并在模型的基础上实现了一个应用。 全文共分6个部分: 1.网络信息组织概述。简要介绍了中国网络资源的现状,信...

【文章页数】:71 页

【学位级别】:硕士

【文章目录】:
中文摘要
英文摘要
0 引言
    0.1 选题的原因和意义
    0.2 研究现状
    0.3 论文的研究内容、研究方法和创新之处
        0.3.1 研究内容
        0.3.2 研究方法
        0.3.3 本文的创新
1 网络信息组织与检索概述
    1.1 中国网络资源概况
    1.2 信息组织的功能
    1.3 网络环境下的信息组织与检索
        1.3.1 网络信息资源的特点
        1.3.2 网络信息组织与检索方法的现状分析
2 网络环境下信息检索的模式研究
    2.1 引言
    2.2 网络信息资源的组织模式
    2.3 主题和索引:两种不同模式的信息组织结构
    2.4 搜索引擎技术
        2.4.1 搜索引擎的分类
        2.4.2 搜索引擎原理
    2.5 搜索引擎模式在信息资源组织中的作用
3 搜索引擎的缺陷和看不见的网站
    3.1 搜索引擎出现的问题
        3.1.1 搜索引擎的覆盖率问题
        3.1.2 搜索引擎的更新率问题
        3.1.3 搜索引擎的排序和网页垃圾问题
    3.2 看不见的网站
        3.2.1 什么是“看不见”的网站
        3.2.2 看不见的网站的形成
4 解决问题的尝试—WIORS系统模型
    4.1 建立 WIORS模型的理论基础
        4.1.1 网络信息资源的本质属性
        4.1.2 模型的理论和数据依据
    4.2 WIORS模型总体概述
        4.2.1 WIORS模型的目标
        4.2.2 WIORS模型的主要功能
    4.3 WIORS模型的系统架构和主要模块
        4.3.1 信息抓取子系统
        4.3.2 全文检索子系统
        4.3.3 信息表示子系统
5 WIORS模型中的关键技术实现
    5.1 信息源的过滤技术
        5.1.1 划分信息源
        5.1.2 分析信息源
        5.1.3 Web信息抽取
    5.2 利用 Lucene实现的全文检索
        5.2.1 Lucene简介
        5.2.2 Lucene的组成结构
        5.2.3 Lueene倒排索引原理
    5.3 基于语料统计实现中文自动分词算法
        5.3.1 分词的必要性
        5.3.2 ICTCLAS系统与Java调用
        5.3.3 在 Lucene中调用 ICTCLAS
    5.4 基于 RSS的推的技术
        5.4.1 RSS简介
        5.4.2 将信息推给客户端
6 模型应用:对校园招聘信息资源进行组织
    6.1 引言
    6.2 应用系统的环境配置
        6.2.1 硬件环境
        6.2.2 软件环境
    6.3 信息源的选择
    6.4 信息源的处理
        6.4.1 信息源的配置
        6.4.2 对信息进行抓取和建立索引
        6.4.3 对信息源的过滤
    6.5 构建校园招聘信息门户
    6.6 应用结论
7 总结
参考文献
后记



本文编号:3852188

资料下载
论文发表

本文链接:https://www.wllwen.com/tushudanganlunwen/3852188.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户805b2***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com