当前位置:主页 > 科技论文 > 搜索引擎论文 >

搜索引擎技术的研究——基于后缀数组的搜索技术

发布时间:2016-07-16 20:11

  本文关键词:搜索引擎技术的研究——基于后缀数组的搜索技术,由笔耕文化传播整理发布。


搜索引擎技术的研究——基于后缀数组的搜索技术

作者:刘荷花 出处:《中国教育信息化》2011年 4月上 总第250期

  摘 要:本文对搜索引擎Google的网页级别(PageRank)技术进行了研究,整合各种技术和方法,总结出PageRank的计算方法。对搜索引擎建立索引的技术加以改进,将数据挖掘中的数据分类技术、自动化中的用户负反馈技术、后缀数组引入搜索引擎,大大提高了搜索引擎的查准率。
  关键词:搜索引擎;数据分类;负反馈;数据挖掘
  中图分类号:TP31  文献标识码:A  文章编号:1673-8454(2011)07-0085-03

  目前,对网上信息的高效、智能检索机制已成为计算机网络领域的研究热点。搜索引擎是帮助互联网用户查询信息的搜索工具,它搜集、发现信息,对信息进行理解、提取、组织和处理,为用户提供检索服务。

  一、搜索引擎的原理

  搜索引擎起源于传统的信息全文检索理论。搜索引擎包括全文检索系统、自动收集网页的数据搜集系统、检索结果的页面生成系统,利用网页收集程序(被称为Robot,, Spider, Crawler)自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其他网页,或转移到其他站点上。Crawler搜集的网页被加入到搜索引擎的数据库中,供用户查询使用。

上一篇:基于嵌入式DVR/DVS的视频监控系统在实验教学中的应用
下一篇:一种基于数字水印技术的文本文档版权保护方案

推荐阅读


  本文关键词:搜索引擎技术的研究——基于后缀数组的搜索技术,由笔耕文化传播整理发布。



本文编号:72181

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/72181.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户5320e***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com