基于决策树的智能广告识别系统的设计与实现
发布时间:2017-12-03 06:02
本文关键词:基于决策树的智能广告识别系统的设计与实现
【摘要】:在当代,互联网技术和无线网络技术的飞速发展给人们的生活带来了很多便利,通过易于获得的智能终端,互联网用户能够非常轻松的实现网络接入。网络广告作为一种新型的媒体形式,凭借其自身具备的诸多优点以及互联网的平台,正在日常生活中扮演着日益重要的地位。然而随着网络安全问题日益突出,由网络广告所带来的负面影响也日益凸显,为了保护互联网用户的利益,因此产生了设计和实现一个能够对广告进行识别的智能系统的需求。为了解决提出的问题,本文进行了如下的研究:(1)针对本文提出的问题,对互联网广告的一般投放方式进行了研究,发现了用户所访问的正常网页与广告之间所存在的伴生关系,根据这种伴生关系在用户数据包所包含的时间信息中所体现的具体特征以及用户数据包中所包含的其他信息,提出了一种以采集到的用户数据包作为数据来源,采用数据挖掘技术中的分类算法来实现广告识别的方法。按照本课题中所提出问题的实际情况将广告识别问题转化为有监督学习问题。(2)通过分析解决数据包分类问题的需求给出了从初始数据中选取的数据属性,对决策树分类算法中的C4.5算法进行了详细研究,掌握了算法的计算过程,提出了根据图论的相关知识对用户数据进行处理的方法,同时通过提出新概念的方式给出了对于时间属性的处理方法,结合用户数据的特征提出了对数据包进行分类的新方法,(3)按照新方法的指导提出了具体的实验步骤,实验将使用经过处理后的数据作为输入,将数据输入到算法中后,得到的输出便是一棵决策树,之后对算法生成的决策树进行了解释和性能评估,经过实验表明新的分类方法具有比较理想的准确性,通过该方法能够比较成功地实现网络广告的识别。(4)根据不同模块所应具有的功能,对各个模块的工作情况进行了介绍,同时将这五个模块全部实现,分别实现各个模块之后进行了整合经过整合最终实现了文中开始提到的智能广告识别系统。
【学位授予单位】:北京化工大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:O157.5;TP311.13
【相似文献】
中国重要报纸全文数据库 前1条
1 本报记者 薛娟;推出禁止追踪功能 360浏览器自证清白[N];中国经济时报;2012年
中国硕士学位论文全文数据库 前2条
1 袁莉;“智能广告系统:把上下文广告引入手机应用程序”汉译实践报告[D];西北师范大学;2015年
2 刘昊泽;基于决策树的智能广告识别系统的设计与实现[D];北京化工大学;2016年
,本文编号:1247652
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/1247652.html