当前位置:主页 > 科技论文 > 搜索引擎论文 >

可搜索压缩算法的设计与实现及其在ClamAV中的应用

发布时间:2020-12-04 10:00
  当前,由于互联网技术的提高和网络的飞速发展,数据信息出现了快速地增长。伴随着数据量的增长,对海量数据的存储、传输以及处理都出现了更高的要求。对大量的数据如何能够在减少其空间占用的同时又能快速地对其进行检索查找,成为了一个新的可以探索并且需要解决的问题。在本文中我们提出了一种方法,这种方法采用一种新的压缩模式来对数据进行处理。与一般压缩模式的处理方法不同的是,该压缩模式在减少数据文件大小的同时,支持在压缩文件中直接进行检索查找等相关操作,从而达到了在减少数据存储空间占用的同时对数据进行快速查找检索的双重目的。本文所提出的压缩算法是采用基于压缩字典的字符串替换方法,该方法对文本的处理是在字节流上进行处理,所以其适用于一切文件类型。其处理过程的主要思想是将文本中高频出现的字节对(即连续的两个字节)与文本中低频出现的单个字节进行交换。当文中我们选中的字节对出现的频率高于文中我们选中的字节出现的频率时,对文本进行压缩,就会产生压缩效果。对于自然文本,基本都会达到压缩效果。另外,对用于进行压缩的字节对和字节,为避免压缩和解压过程出现二义性,需要对它们的选取加以限制,即所选取的任意两个字节对之间不能... 

【文章来源】:吉林大学吉林省 211工程院校 985工程院校 教育部直属院校

【文章页数】:60 页

【学位级别】:硕士

【部分图文】:

可搜索压缩算法的设计与实现及其在ClamAV中的应用


本文的组织结构

压缩模式,查找过程,查找程序,压缩算法


图 2.2 可查找压缩模式的查找过程Manber 将该查找压缩算法应用在了两个查找程序中进行了实验。实验结下(作者的实验运行在 DECstation 5000/240,Ultrix 上),单位为秒(s)

系统结构图,系统结构图


图 4.1 ClamAV 系统结构图C1amAV 反病毒系统的框架设计各部分分工明确,逻辑较为清晰,可从五面划分:第一步,读取病毒库。系统通过调用 int c1_load()从指定路径下读取病。第二步,病毒引擎初始化。在病毒库加载成功后,系统通过调用函数 i1_build()开始进行引擎加载及参数配置,其中涉及包括了对各算法数据结构始化。待各参数完成初始化后进行加载。用数字 0 来表明加载成功,其他说载不成功。第三步,初步检查扫描。查毒系统通过调用 c1_scandesc()函数通过扫描传入的文件特征和扫描参数调用对应的函数对文件进行初步的扫描。cli_scandesc()函数的执行过程大致如下:系统先执行精准模式匹配程序据输入文件的类型对其进行查找,使用 BM 模式匹配算法调用函


本文编号:2897399

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2897399.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户3ebda***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com