当前位置:主页 > 管理论文 > 移动网络论文 >

基于滑动事件窗口的图书馆资源恶意下载检测系统研究与实现

发布时间:2020-05-13 17:49
【摘要】:近年来,高校内图书馆资源恶意下载频发,电子资源商一旦发现恶意下载,将立即停止违规IP/IP段的使用权限,使得高校内所有用户无法正常使用电子资源库,严重影响高校中正常用户的使用。因此展开对图书馆资源恶意下载检测的研究具有重要的研究意义。目前,各大高校已根据自身情况对文献下载流量统计与监控进行了研究,大多通过对异常流量、过高下载频率、异常访问请求内容的监控分析判断恶意下载,存在模糊定量、无法精确判断、误判率较高等问题,且对现有的具有伪装能力的低速随机时间间隔爬虫来说不起作用。另外,目前的恶意下载检测均基于IP进行检测,面对校园NAT环境及IP伪造技术时无法识别恶意下载用户真实身份。为解决以上问题,本论文针对图书馆场景,提出一种基于滑动事件窗口的恶意下载检测的算法,将文本内容上的主题相关性作为恶意下载检测依据,利用滑动事件窗口实现检测的随机性,使用聚类算法进行主题聚类,从而进行恶意下载检测。基于所提出的恶意下载检测算法,本研究设计并实现一套图书馆资源恶意下载检测系统。系统利用图书馆资源主题数据收集模块获取用户文献下载请求信息与相关标题或摘要;通过[IP→账号]映射模块与用户账号信息进行关联;在用户行为数据处理模块中提取摘要主题句,统一规范数据,并根据用户账号构建滑动事件窗口;在恶意下载检测模块中通过聚类分析窗口内请求的主题相关性,从而进行恶意下载检测;最后将恶意下载用户信息推送至外部系统,实现告警效果。系统部署在某高校图书馆环境中进行了测试,结果表明,该系统能在传统的基于特征的检测手段上,进一步根据用户请求的主题相关性进行恶意下载检测,对低速的随机时间间隔爬虫具有良好的识别效果。
【图文】:

正向,工作原理,反向代理,源服务器


2.3反向代理逡逑本课题所述系统,需要通过反向代理[16]对用户的图书馆资源访问/下载行为逡逑数据进行统一收集,因此本节主要对反向代理进行介绍,包括反向代理工作原理、逡逑Nginx及其配置文件。逡逑2.3.1反向代理工作原理逡逑在计算机网络中,,反向代理是代理服务器中的一种,其名称为相对于正向代逡逑理而来。逡逑正向代理服务器一般位于客户端和源服务器(origin邋server)之间,偏向客户端逡逑侧,与客户端同属于一个LAN,对源服务器透明。客户端必须通过正确设置正逡逑向代理服务器IP地址及代理程序端口后,才可正常使用正向代理。为从源服务逡逑器获得所需内容,客户端需首先向正向代理服务器发送请求并指定其请求目标,逡逑即源服务器;然后正向代理向源服务器转发访问请求,并将获得的内容返回给客逡逑户端。客户端是通过主动访问代理服务器实现对源服务器的访问。逡逑

过程图,反向代理,工作流程,工作原理


图2-3反向代理工作原理逡逑如图2-3所示,反向代理的工作流程包括以下几个过程:逡逑1;逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP393.08

【相似文献】

相关期刊论文 前10条

1 罗杰;;优化主题信息及材料收集与利用的探讨[J];山东教育;2016年Z2期

2 祁宁;吴齐;赵青;;面向主题信息服务的垂直搜索引擎应用研究[J];图书馆学研究;2008年09期

3 曾利沙;论旅游指南翻译的主题信息突出策略原则[J];上海翻译;2005年01期

4 丁国君;;小学主题信息教育的探索与实践[J];中小学电教;2002年09期

5 唐建;洪宇;刘梦眙;姚亮;姚建民;;融合图片主题信息的图片描述翻译[J];中文信息学报;2019年07期

6 陈雄;都云程;李渝勤;施水才;;基于页面结构分析的论坛主题信息定位方法研究[J];微计算机信息;2010年27期

7 吴筱媛,邓红素,顾宁;基于主题信息和相关信息发现的元数据描述方法[J];计算机工程;2002年02期

8 田丽;;情报分析中提取主题信息核心要素的模型及方法[J];计算机与现代化;2018年10期

9 梁田;;个性化科研主题信息环境构建技术方案实践[J];图书情报工作;2012年S2期

10 罗长寿;康丽;刘国靖;;基于遗传算法的主题信息搜索系统研究[J];现代情报;2009年03期

相关会议论文 前8条

1 冯少卿;都云程;施水才;;基于模板的网页主题信息抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

2 李燕;李胜阳;许志辉;朱子建;李长松;;基于本体语义的流域决策主题信息组织研究[A];大数据时代的信息化建设——2015(第三届)中国水利信息化与数字水利技术论坛论文集[C];2015年

3 王琦;唐世渭;杨冬青;王腾蛟;;基于DOM的网页主题信息自动提取[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年

4 刁宇峰;王昊;林鸿飞;杨亮;;博客中重复评论发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年

5 刁宇峰;林鸿飞;;基于LDA模型的博客垃圾评论发现[A];第六届全国信息检索学术会议论文集[C];2010年

6 王玉婷;杜亚军;涂腾涛;;基于Web链接的主题爬行虫初始URL的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

7 何莉;林鸿飞;;分布式检索中基于主题的语言模型集合选择策略[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年

8 田少娟;魏慧楠;王镭;;基于LDA主题模型的评论热点挖掘与手机产品性能分析[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年

相关博士学位论文 前2条

1 梁晓贺;基于超网络分析的微博舆情主题发现研究[D];中国农业科学院;2019年

2 周厚奎;概率主题模型的研究及其在多媒体主题发现和演化中的应用[D];浙江大学;2017年

相关硕士学位论文 前10条

1 董德鸣;面向主题搜索引擎的若干关键技术的研究[D];沈阳建筑大学;2016年

2 雷俐;基于主题的微博重叠社区发现研究[D];中南财经政法大学;2018年

3 郭思琦;基于滑动事件窗口的图书馆资源恶意下载检测系统研究与实现[D];北京邮电大学;2019年

4 刘竹辰;基于层次主题模型的网络热点分析研究与实现[D];北京邮电大学;2019年

5 叶康;基于主题模型和注意力机制的短文本方面提取研究[D];南京大学;2019年

6 陈明;基于主题翻译模型的社区问答中问句检索技术研究[D];武汉理工大学;2018年

7 张秋楠;面向兴趣主题的新浪微博个性化推荐方法[D];河南大学;2018年

8 孙淑娴;基于矩阵分解的长尾主题挖掘算法的研究与实现[D];山东师范大学;2018年

9 张昂;基于改进词加权算法的主题模型研究[D];吉林大学;2018年

10 王丽君;词向量和文本隐含主题的联合学习研究[D];华中师范大学;2018年



本文编号:2662312

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2662312.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户4fab4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com