搜索引擎技术的研究——基于后缀数组的搜索技术
本文关键词:搜索引擎技术的研究——基于后缀数组的搜索技术,由笔耕文化传播整理发布。
搜索引擎技术的研究——基于后缀数组的搜索技术
作者:刘荷花 出处:《中国教育信息化》2011年 4月上 总第250期
摘 要:本文对搜索引擎Google的网页级别(PageRank)技术进行了研究,整合各种技术和方法,总结出PageRank的计算方法。对搜索引擎建立索引的技术加以改进,将数据挖掘中的数据分类技术、自动化中的用户负反馈技术、后缀数组引入搜索引擎,大大提高了搜索引擎的查准率。
关键词:搜索引擎;数据分类;负反馈;数据挖掘
中图分类号:TP31 文献标识码:A 文章编号:1673-8454(2011)07-0085-03
目前,对网上信息的高效、智能检索机制已成为计算机网络领域的研究热点。搜索引擎是帮助互联网用户查询信息的搜索工具,它搜集、发现信息,对信息进行理解、提取、组织和处理,为用户提供检索服务。
一、搜索引擎的原理
搜索引擎起源于传统的信息全文检索理论。搜索引擎包括全文检索系统、自动收集网页的数据搜集系统、检索结果的页面生成系统,利用网页收集程序(被称为Robot,, Spider, Crawler)自动访问Web站点,提取站点上的网页,并根据网页中的链接进一步提取其他网页,或转移到其他站点上。Crawler搜集的网页被加入到搜索引擎的数据库中,供用户查询使用。
上一篇:基于嵌入式DVR/DVS的视频监控系统在实验教学中的应用
下一篇:一种基于数字水印技术的文本文档版权保护方案
推荐阅读
本文关键词:搜索引擎技术的研究——基于后缀数组的搜索技术,由笔耕文化传播整理发布。
本文编号:72181
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/72181.html