多线程Web图像搜索器的磁盘I/O缓冲方法
发布时间:2020-12-04 00:06
频繁的磁盘I/O操作导致多线程Web图像搜索器的性能显著下降,为此提出一种磁盘I/O缓冲方法,它包括待采URL的双队列缓冲和图像存储与URL存储中的循环缓冲池等2种措施.在URL待采队列中采用双队列缓冲,当其中一个队列处于使用状态时,另一队列执行从磁盘读取新URL的操作,使得各个线程可以不间断地获取URL.2个循环缓冲池分别用于图像和URL磁盘存储操作中,其工作原理相同.实验结果显示,磁盘I/O缓冲方法显著改善了多线程Web图像搜索器的性能.
【文章来源】:郑州大学学报(理学版). 2010年01期 第33-37页 北大核心
【文章页数】:5 页
【部分图文】:
具有磁盘I/O缓冲的多线程Web图像搜索器结构
URL待采队列的作用是保证线程之间不重复搜集互联网上的页面以及系统的并行性.URL待采队列采用双缓冲队列结构,即它有2个相同的队列,Q1和Q2.图2是URL待采队列的4个工作状态图.图2(a)表示多线程Web图像搜索器刚启动时URL待采队列的状态.此时Q1首先从URL索引数据库中读取待访问的URL供各个线程到网上采集,当前指针C指向Q1.各个线程对Q1是互斥访问的,从而避免了重复搜集.一个线程访问Q1结束后,该指针C要向后移动一位,直到将Q1读空为止.图2(b)表示在各个线程读取Q1的同时,系统从URL索引数据库中读取待访问的URL并存入Q2队列中,直到Q2队满.图2(c)表示当Q1队空后,系统立即将当前指针C指向Q2队列的队头
本文编号:2896683
【文章来源】:郑州大学学报(理学版). 2010年01期 第33-37页 北大核心
【文章页数】:5 页
【部分图文】:
具有磁盘I/O缓冲的多线程Web图像搜索器结构
URL待采队列的作用是保证线程之间不重复搜集互联网上的页面以及系统的并行性.URL待采队列采用双缓冲队列结构,即它有2个相同的队列,Q1和Q2.图2是URL待采队列的4个工作状态图.图2(a)表示多线程Web图像搜索器刚启动时URL待采队列的状态.此时Q1首先从URL索引数据库中读取待访问的URL供各个线程到网上采集,当前指针C指向Q1.各个线程对Q1是互斥访问的,从而避免了重复搜集.一个线程访问Q1结束后,该指针C要向后移动一位,直到将Q1读空为止.图2(b)表示在各个线程读取Q1的同时,系统从URL索引数据库中读取待访问的URL并存入Q2队列中,直到Q2队满.图2(c)表示当Q1队空后,系统立即将当前指针C指向Q2队列的队头
本文编号:2896683
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2896683.html