当前位置:主页 > 科技论文 > 自动化论文 >

基于机器学习的第三方追踪和反广告拦截检测系统

发布时间:2020-06-30 09:44
【摘要】:随着现代化的不断发展,为了丰富网页内容和吸引更多用户,很多网站会在网页中嵌入第三方应用程序~([1])。第三方应用程序可以美化网页,提升用户与网页的交互好感。然而也存在一部分第三方应用程序在服务网页的同时会侵犯用户的隐私信息。它们通过收集用户的浏览历史以及用户在网页中的一系列交互行为来分析用户的喜好,从而制定适合特定用户的广告。还有一些第三方应用程序试图了解用户更加私密的信息,包括怀孕生育、修复不良信贷等。为了保护用户隐私信息,研究人员和政府机构已经提出了一系列的保护措施。其中最有效的方式之一便是使用黑名单来拦截具有追踪行为的第三方应用程序。具有追踪行为的第三方应用程序通常以四种方式存在于网页中,包括web bugs、iframe、JavaScript文件和Flash文件~([2,3])。Flash文件在第三方追踪中起着非常重要的作用。本篇论文开发了一个系统DFTrackerDetector,其主要对网页中的第三方Flash文件进行检测,查看其是否具有追踪行为。根据不同的行为方式和不同的目的,Flash文件会调用不同的ActionScript API。因此DFTrackerDetector以ActionScript API为特征,利用静态分析的方法对特征进行提取,最终利用机器学习算法构建分类器并自动化生成追踪者名单列表。DFTrackerDetector在测试集中具有94.73%的准确率。广告在互联网的发展过程中起着举足轻重的作用。网站会在网页中留出一定的位置展示广告并赚取一定的费用,因此用户可以在终端获得免费服务。但是由于利益的驱使,造成了一些网站对广告的滥用。一些广告会被放到非常明显的位置以至于影响用户的正常阅读,还有一些广告会追踪用户信息,造成用户隐私信息的泄露。随着用户对保护个人隐私意识的不断提高,为了获取一个干净安全的浏览环境,越来越多的广告拦截插件被安装到浏览器中。用户的这一行为严重影响了在线广告行业的商业模式,使得广告商不得不对此行为实施一系列的反击措施。一些网站参加了所谓的“可接受的广告计划”,从而该网站的广告不被广告拦截器屏蔽,可以完整的被展现在网页中。还有一些网站会在网页中部署JavaScript文件来检测用户的浏览器中是否安装了广告拦截器。检测到广告拦截器后,JavaScript文件会做出一系列的响应,一些JavaScript文件要求用户完全禁用广告拦截器或者将该网站列入白名单,还有一些JavaScript文件要求用户进行捐赠以正常浏览网页。为了应对广告商的反击,广告拦截器也正在检测和过滤反广告拦截器。为了快速生成反广告拦截器的名单列表,本文提出了一个基于机器学习的反广告拦截检测系统ABDetector。具有反广告拦截行为的JavaScript文件和没有反广告拦截行为的JavaScript文件会调用不同的JavaScript API。因此ABDetector将JavaScript API作为特征来建立分类器,不同于其它特征提取的方法,本文使用动态分析的方法来提取JavaScript文件中的特征。在测试集上ABDetector的准确率为81.46%。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:TP309;TP181

【相似文献】

相关期刊论文 前10条

1 李兵;林文钊;罗峥尹;;基于机器学习的智慧农业决策系统设计与实现[J];信息与电脑(理论版);2018年24期

2 舒娜;刘波;林伟伟;李鹏飞;;分布式机器学习平台与算法综述[J];计算机科学;2019年03期

3 刘传会;汪小亚;郭增辉;;机器学习在反洗钱领域的应用与发展[J];清华金融评论;2019年04期

4 孟雨;;机器学习让计算机更智能[J];计算机与网络;2019年14期

5 高华川;;机器学习在经济学中的应用[J];纳税;2019年24期

6 李阳;;机器学习在网络空间安全研究中的应用分析[J];电脑知识与技术;2019年24期

7 胡思润;杨晓旭;宋靖华;;基于机器学习的城市生成方法研究[J];智能建筑与智慧城市;2019年11期

8 蒋良孝;;机器学习课程教学的实践探索[J];新课程研究;2019年23期

9 ;降低机器学习门槛的六大工具[J];电脑知识与技术(经验技巧);2019年10期

10 朱辉;;机器学习在企业级场景中的实践与探讨[J];中国建设信息化;2018年03期

相关会议论文 前10条

1 王珏;;归纳机器学习[A];2001年中国智能自动化会议论文集(上册)[C];2001年

2 王衍鲁;张利会;张淑洁;石洁茹;王鹏;;大学新生学校适应的个体与环境因素探究:基于机器学习的考察[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年

3 张长水;;大数据机器学习[A];2015年中国自动化大会摘要集[C];2015年

4 何琳;侯汉清;;基于标引经验和机器学习相结合的多层自动分类[A];2005年中国索引学会年会暨学术研讨会论文集[C];2005年

5 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年

6 徐礼胜;李乃民;王宽全;张冬雨;耿斌;姜晓睿;陈超海;罗贵存;;机器学习在中医计算机诊断识别系统中的应用思考[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年

7 吴沧浦;;智能系统与机器学习的新领域[A];西部大开发 科教先行与可持续发展——中国科协2000年学术年会文集[C];2000年

8 蔡健平;林世平;;基于机器学习的词语和句子极性分析[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年

9 ;基于机器学习的大数据防诈骗能力研究与应用[A];2018中国信息通信大会论文摘要集[C];2018年

10 ;基于机器学习的影响感知无线根因问题快速定位研究[A];2018中国信息通信大会论文摘要集[C];2018年

相关重要报纸文章 前10条

1 CIO.com资深作家 Clint Boulton 编译 Charles;领先一步:机器学习的10个成功案例[N];计算机世界;2018年

2 Bob Violino 编译 Charles;盲目冒进:机器学习的5个失败案例[N];计算机世界;2018年

3 本报驻波士顿记者 侯丽;深入挖掘机器学习潜力[N];中国社会科学报;2019年

4 王方 编译;菌自何方 机器学习早知道[N];中国科学报;2019年

5 Matt Asay 编译 Monkey King;为什么机器学习没有捷径可循?[N];计算机世界;2019年

6 本报记者 操秀英;当量子计算遇到机器学习会碰撞出什么火花?[N];科技日报;2019年

7 彭博企业数据业务全球负责人 Gerard Francis;金融数据质量决定机器学习时代的投资回报[N];计算机世界;2019年

8 Isaac Sacolick 编译 Charles;关于机器学习的5个要点[N];计算机世界;2019年

9 记者 张梦然;全新算法助机器学习抵抗干扰[N];科技日报;2019年

10 惠赞瑾;《科学向左,科幻向右》:机器学习即将成为现实[N];中国会计报;2019年

相关博士学位论文 前10条

1 刘浏;基于机器学习的恶意代码检测与分类技术研究[D];国防科技大学;2017年

2 薛红新;基于机器学习方法的分类与预测问题研究[D];中北大学;2019年

3 韩启迪;基于非线性成矿动力系统的机器学习方法应用研究[D];中国地质大学(北京);2019年

4 殷曦;基于机器学习及统计计算模型的膜蛋白结构预测[D];上海交通大学;2017年

5 杨静;蛋白质残基相互作用预测及其在结构建模中的应用研究[D];上海交通大学;2018年

6 王磊;基于机器学习的药物—靶标相互作用预测研究[D];中国矿业大学;2018年

7 张庆;钙钛矿型功能材料的基因组工程研究[D];上海大学;2018年

8 管月;医学肿瘤影像分类算法研究及其在肝癌上的应用[D];南京大学;2018年

9 郝小可;基于机器学习的影像遗传学分析及其应用研究[D];南京航空航天大学;2017年

10 施建明;基于机器学习的产品剩余寿命预测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年

相关硕士学位论文 前10条

1 夏怡童;《机器学习前沿:2017雷蒙德和贝弗利·萨克勒英美科学论坛》翻译实践报告[D];重庆邮电大学;2019年

2 李逍;产品评论的方面级观点挖掘技术研究[D];重庆邮电大学;2019年

3 张辉斌;基于机器学习的机电系统部件级PHM技术研究[D];南京航空航天大学;2019年

4 卞荣臻;基于机器学习的硬件木马检测方法研究[D];南京航空航天大学;2019年

5 叶诗意;《机器学习—新型人工智能》(节选)翻译实践报告[D];湘潭大学;2019年

6 郭银娟;基于多元统计和机器学习的成绩分析及研究[D];湘潭大学;2019年

7 赵庆东;基于机器学习算法的数据分类应用研究[D];宁夏大学;2019年

8 巢泽敏;Spark自动调优系统的设计与实现[D];哈尔滨工业大学;2019年

9 胡乐;融合用户评论的新闻内容质量检测算法研究[D];哈尔滨工业大学;2019年

10 崔宇中;用于割草机平台的行人检测技术研究[D];哈尔滨工业大学;2019年



本文编号:2735171

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/2735171.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户59c55***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com