基于指纹分析的Web访问识别技术研究
发布时间:2020-05-13 01:42
【摘要】:Web技术的不断革新推动了互联网的发展,为人们提供了可随时随地访问的服务,深刻地改变了人类社会信息获取、交互和展现的方式。但由于网络身份管理机制的缺失以及SSH代理等匿名工具的广泛使用,网络谣言、网络欺诈、网络恐怖主义等问题日趋严峻,传统的基于IP地址、域名、Cookie、用户账号等显性标识的Web追踪技术已无法满足网络监管的需求。因此,有必要对Web应用中的三个参与主体——终端设备、Web服务器以及网络用户进行深入分析,研究基于隐性标识的指纹识别技术,即通过浏览器指纹识别关联用户的终端设备、通过网站流量指纹识别用户所访问服务器的真实地址、通过流量行为指纹识别用户实体,从而实现对Web访问的有效监管。由于基于隐性标识的指纹识别技术本质上是一种侧信道攻击手段,并不依赖于显性标识,所利用的指纹也不易被隐藏或篡改,因此是目前的研究热点。虽然现有工作已初步展现了它的有效性,但实际应用时在识别准确率和方法实用性方面依然存在较大的局限性。具体而言,在浏览器指纹识别方面,现有研究本质上均是对浏览器的唯一标识,当浏览器指纹发生改变时,无法进行有效识别;而对于Web服务器识别,一方面识别准确率有待进一步提高,另一方面现有工作的攻击模型限制较大,要求不存在任何背景流量,实用性不高;在用户实体识别方面,相关的研究工作较少且对于用户的Web访问行为刻画不够精准,所选特征存在模糊、易抖动等问题。针对上述问题,论文在以下四个方面展开了研究:首先,针对桌面浏览器指纹可能出现变化的情况,分别提出了基于加权近邻和贝叶斯网络的浏览器指纹匹配算法,实现对用户浏览器的识别和关联。其次,针对匿名Web流量,依据用户访问关联Web页面的行为模式,提出了一种基于页面关联的网站指纹识别方法,通过对目标网站建立相应的隐马尔科夫模型,提高指纹识别的准确率;并对通用攻击模型的合理性进行了分析讨论,针对存在背景流量的情况给出了初步的解决方案。然后,针对用户实体识别问题,在准确刻画用户访问行为的基础上,从网络流量中提取目的域名、频数、Web查询类别等特征对用户行为和偏好建立抽象模型,并利用贝叶斯分类器对行为指纹进行分类,实现用户实体的识别和关联。最后,在理论研究的基础上,设计并实现了一套用户Web访问识别工具原型系统,并在Internet环境下进行了部署和测试。论文对基于隐性标识的指纹识别技术进行了深入的研究,针对Web访问监管的需求,以终端设备、Web服务器以及网络用户三个参与主体为对象,提出了一整套高效、实用的指纹识别技术。与现有研究工作相比,论文所提出的终端设备识别、Web服务器识别和用户实体识别方法具有更高的准确率和实用性,这对实现Web访问监管具有重要意义。
【图文】:
章通过对 Web 服务发展的相关背景进行介绍,引出了论文的研究动机。然后分别对终端设备指纹识别技术、网站指纹攻击技术和用户实体指研究现状进行分析和总结,指出其中存在的问题,最后提出本文的研究并阐述论文的组织结构。1.1 研究背景eb 技术的不断革新推动了互联网的发展,为人们提供了可随时随地访刻地改变了人类社会信息获取、交互和展示的方式。据统计,截至 201仅中国地区,就有 533 万个网站,2604 亿个网页,用户人数到达 7.72的爆炸式增长,Web 应用承载的业务种类也非常丰富,如图 1-1 所示,、社交网络、电子商务、网上银行、在线视频、在线游戏、网上订餐等,用户只需要通过浏览器就能方便快捷地获取所需的服务。报告显示,超都会使用搜索引擎服务,而网上订餐服务的用户人数年增长率高达 64.
本论文由六个章节构成,各章节之间的组织关系如图1-4 所示。其中,第 1 章为绪论,,第 2 章为基于浏览器指纹的终端设备识别技术,第3 章为基于网站指纹的 Web 服务器识别技术,第 4 章为基于流量行为指纹的用户实体识别技术,第 2 章到第 4 章是针对网络中三个主要参与对象的监管问题展开的理论研究,第 5 章的原型系统是对上述理论成果的集成与应用,第 6 章对全文进行了总结和展望。第1章 绪论第2章基于浏览器?
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP391.41;TP393.09
本文编号:2661168
【图文】:
章通过对 Web 服务发展的相关背景进行介绍,引出了论文的研究动机。然后分别对终端设备指纹识别技术、网站指纹攻击技术和用户实体指研究现状进行分析和总结,指出其中存在的问题,最后提出本文的研究并阐述论文的组织结构。1.1 研究背景eb 技术的不断革新推动了互联网的发展,为人们提供了可随时随地访刻地改变了人类社会信息获取、交互和展示的方式。据统计,截至 201仅中国地区,就有 533 万个网站,2604 亿个网页,用户人数到达 7.72的爆炸式增长,Web 应用承载的业务种类也非常丰富,如图 1-1 所示,、社交网络、电子商务、网上银行、在线视频、在线游戏、网上订餐等,用户只需要通过浏览器就能方便快捷地获取所需的服务。报告显示,超都会使用搜索引擎服务,而网上订餐服务的用户人数年增长率高达 64.
本论文由六个章节构成,各章节之间的组织关系如图1-4 所示。其中,第 1 章为绪论,,第 2 章为基于浏览器指纹的终端设备识别技术,第3 章为基于网站指纹的 Web 服务器识别技术,第 4 章为基于流量行为指纹的用户实体识别技术,第 2 章到第 4 章是针对网络中三个主要参与对象的监管问题展开的理论研究,第 5 章的原型系统是对上述理论成果的集成与应用,第 6 章对全文进行了总结和展望。第1章 绪论第2章基于浏览器?
【学位授予单位】:东南大学
【学位级别】:博士
【学位授予年份】:2018
【分类号】:TP391.41;TP393.09
【参考文献】
相关期刊论文 前1条
1 张璐;罗军舟;杨明;何高峰;;基于时隙质心流水印的匿名通信追踪技术[J];软件学报;2011年10期
本文编号:2661168
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/2661168.html