基于访问路径挖掘的Web缓存与预取模型研究
发布时间:2017-05-19 06:02
本文关键词:基于访问路径挖掘的Web缓存与预取模型研究,,由笔耕文化传播整理发布。
【摘要】:随着互联网的发展,尤其移动互联网的发展,Web用户快速增长。但因网络带宽和服务器的数量增长相对滞后,造成了用户使用互联网服务的时间延迟。由于硬件投入的成本较大,缓存系统因此成为解决网络延迟的有效方式。 缓存替换算法对缓存系统的性能有较大影响。本文在对经典的GDSF替换算法进行研究的基础上,结合Web日志挖掘生成的预测队列,对GDSF进行改进,提出了基于预测的缓存替换算法-——IWAP-GDSF算法,以此来提高缓存算法的命中率。 本文首先对Web日志挖掘算法进行研究,在经典的WAP挖掘算法的基础上,结合Web对象的时间局部性特征,对WAP算法进行改进形成IWAP算法,使其更适合替换算法的预取模型使用。通过对IWAP的日志挖掘结果建立预取模型,本文提出了一种新的预取模型,模型中考虑了预测对象未来在预测序列中的位置和计数信息,作为该对象未来被访问概率的权重,模型生成的预测队列为替换算法提供决策依据。结合预测模型,本文提出了基于预测的缓存替换算法——IWAP-GDSF。新算法在计算目标函数权值时使用预测队列,综合考虑对象的访问频率、取回代价以及未来可能被访问的概率,做出替换决策。最后本文实现了仿真程序模拟用户访问情况,对IWAP-GDSF算法和GDSF算法进行实验。实验结果表明IWAP-GDSF算法在一定缓存空间大小时可以有效提高缓存的文档命中率和字节命中率。
【关键词】:缓存替换 预取模型 Web日志挖掘 WAP算法 GDSF算法
【学位授予单位】:西南交通大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP333
【目录】:
- 摘要6-7
- Abstract7-10
- 第1章 绪论10-16
- 1.1 研究背景与意义10-11
- 1.2 国内外研究现状11-14
- 1.2.1 Web缓存技术研究现状11-12
- 1.2.2 Web预取技术研究现状12-13
- 1.2.3 Web日志挖掘研究现状13-14
- 1.3 本论文研究内容14
- 1.4 本论文章节安排14-16
- 第2章 Web缓存与预取相关理论与技术16-24
- 2.1 Web服务器工作原理概述16-18
- 2.1.1 Web工作流程16-17
- 2.1.2 Web对象被访问特性17-18
- 2.2 Web缓存技术理论分析18-21
- 2.2.1 Web缓存工作原理18-19
- 2.2.2 Web缓存分类19-20
- 2.2.3 Web缓存性能评价标准20-21
- 2.3 Web预取技术理论分析21-23
- 2.3.1 Web预取工作原理21-22
- 2.3.2 Web预取模型22-23
- 2.3.3 Web常见的预取算法23
- 2.4 本章小结23-24
- 第3章 WAP挖掘算法的改进及预取模型研究24-42
- 3.1 Web日志预处理24-29
- 3.1.1 预处理整体流程24-25
- 3.1.2 数据清洗25-26
- 3.1.3 用户识别26-27
- 3.1.4 会话识别27-28
- 3.1.5 路径补充28-29
- 3.2 WAP算法的研究及改进29-40
- 3.2.1 相关定义29-30
- 3.2.2 WAP算法的研究30-33
- 3.2.3 改进的IWAP算法33-39
- 3.2.4 IWAP与WAP对比实验及结果分析39-40
- 3.3 IWAP挖掘的预取模型研究40-41
- 3.4 本章小结41-42
- 第4章 一种新的基于预测的IWAP-GDSF算法42-52
- 4.1 缓存替换算法相关理论42-43
- 4.2 常见的缓存替换算法43-45
- 4.3 基于预测的IWAP-GDSF算法45-51
- 4.3.1 IWAP-GDSF算法原理45-47
- 4.3.2 IWAP-GDSF算法描述47-48
- 4.3.3 IWAP-GDSF算法分析48-51
- 4.4 本章小结51-52
- 第5章 仿真实验及结果分析52-63
- 5.1 开发工具与环境52
- 5.2 仿真的设计实现52-59
- 5.2.1 挖掘实验仿真实现52-55
- 5.2.2 缓存框架仿真实现55-59
- 5.3 仿真实验59-61
- 5.4 实验结果分析61-62
- 5.5 本章小结62-63
- 结论与展望63-65
- 结论63
- 进一步工作63-65
- 致谢65-66
- 参考文献66-70
- 攻读硕士学位期间发表的论文及科研成果70
【参考文献】
中国期刊全文数据库 前7条
1 孙蕾;朱玉全;;频繁序列模式挖掘中关键技术的研究[J];计算机工程;2006年11期
2 徐宝文,张卫丰;数据挖掘技术在Web预取中的应用研究[J];计算机学报;2001年04期
3 石磊;孟彩霞;韩英杰;;基于预测的Web缓存替换策略[J];计算机应用;2007年08期
4 吕冬冬;沈苏彬;;一种基于分段的网络流媒体代理缓存策略[J];南京邮电大学学报(自然科学版);2011年01期
5 余红梅;樊自普;;CDN架构下流媒体代理缓存策略的研究[J];电子测试;2010年03期
6 杨正余;王卫平;;基于用户访问序列的实时网页推荐研究[J];计算机系统应用;2008年05期
7 石磊;张岳;裴云霞;古志民;;基于Web对象流行度的PPM预测模型[J];小型微型计算机系统;2006年07期
本文关键词:基于访问路径挖掘的Web缓存与预取模型研究,由笔耕文化传播整理发布。
本文编号:377865
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/377865.html