动态Web广告的智能获取技术研究
本文关键词:动态Web广告的智能获取技术研究,,由笔耕文化传播整理发布。
【摘要】:随着互联网和电子商务的发展,目前许多公司都通过Web广告来推广自己的产品,很多大型互联网公司的主要收入来源也来自于Web广告,因此目前对Web广告的研究越来越热门。为了研究互联网广告的投放机制,更加科学的投放广告,收集互联网上的广告就成为一项非常有意义的工作,但是,目前针对互联网广告资源采集的研究却没有什么成果,因此,本文主要研究如何从海量的互联网资源中智能地获取尽可能多的Web广告资源。为了快速准确获取互联网中的广告,本文主要做了如下几个工作:首先,提出了一种基于DOM树构建的动态脚本解析算法,在建立页面DOM树的过程中,使用文中所设计的基于Rhino封装后的Javascript解析引擎,解析Web页面中的Javascript脚本,加载页面中的动态数据,最终得到加载完动态信息的完整页面。基于DOM树构建的解析算法在请求动态数据的时候进行了合理的资源分配,因此在解析速度方面比其它动态数据获取方式要快。在章节的最后,通过实验和其它的动态数据获取方式进行了比较,实验证明,算法的速度比其它的方式快。然后,设计了基于页面块分类的Web广告资源定位算法,将页面中广告资源的定位问题转化为二分类问题,在页面分块的基础上,对页面中所有的块进行广告块分类,通过标记其中的广告块,最终实现了广告资源定位的功能。基于页面块分类的广告定位算法,使用页面中的URL串作为分类的特征,拥有分类速度快,准确度高等特点。在章节的后面,对比了几种常用的分类算法在广告定位上的效果,此外,还给出了基于决策树分类的广告定位算法在各种类型的网站上所表现出来的效果,实践证明,基于决策树的广告资源定位算法效果比其它的算法的效果好。最后,实现了动态Web广告的智能获取系统,用系统的实际效果验证了本文所提方法的有效性。
【关键词】:Web广告 Javascript解析 分类 页面分块
【学位授予单位】:哈尔滨工业大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.09
【目录】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 绪论8-14
- 1.1 研究背景和意义8-9
- 1.2 动态Web广告获取研究现状9-12
- 1.2.1 动态页面解析技术研究现状9-11
- 1.2.2 Web页面分块研究现状11-12
- 1.2.3 国内外研究现状总结12
- 1.3 课题研究内容12-13
- 1.4 本文的组织结构13-14
- 第2章 动态WEB广告获取的相关知识14-24
- 2.1 动态页面解析技术14-18
- 2.1.1 Javascript介绍14-15
- 2.1.2 Javascript解析引擎概况15
- 2.1.3 Spider Monkey介绍15-16
- 2.1.4 Rhino介绍16-17
- 2.1.5 文档对象模型17-18
- 2.2 页面分块技术18-19
- 2.3 Web广告的相关知识以及投放技术19-22
- 2.3.1 Web广告20
- 2.3.2 Web广告的投放策略20-22
- 2.4 评价指标及分析22
- 2.5 本章小结22-24
- 第3章 基于DOM树构建的JAVASCRIPT解析算法24-35
- 3.1 DOM树构建算法24-27
- 3.1.1 DOM无效节点分析24-25
- 3.1.2 基于DFA的DOM树构建过程25-27
- 3.2 动态脚本Javascript解析方法27-30
- 3.2.1 需要映射的DOM对象分析28
- 3.2.2 基于Rhino改进的解析引擎28-30
- 3.3 基于DOM树构建的动态页面解析效率分析30-31
- 3.4 实验环境与数据准备31
- 3.5 动态页面解析实验与分析31-34
- 3.5.1 基于DOM树构建的动态页面解析算法实验31-32
- 3.5.2 基于DOM树构建的动态页面解析算法的对比实验32-34
- 3.6 本章小结34-35
- 第4章 基于页面块分类的WEB广告定位算法35-47
- 4.1 一种基于连通分量的页面分块方法35-39
- 4.1.1 基本概念介绍35-36
- 4.1.2 节点距离公式36-38
- 4.1.3 算法核心思想介绍38-39
- 4.2 基于页面块分类的广告资源定位算法39-42
- 4.2.1 广告资源定位算法的特征40-41
- 4.2.2 分类算法用于广告分类的过程41-42
- 4.3 实验环境与数据准备42
- 4.4 Web广告资源定位实验与分析42-46
- 4.4.1 各分类算法的对比实验43-44
- 4.4.2 基于决策树分类的广告资源定位算法实验44-46
- 4.5 本章小结46-47
- 第5章 动态WEB广告智能获取系统47-54
- 5.1 系统功能与开发环境47-48
- 5.2 系统总体设计48-49
- 5.3 系统模块详细设计49-52
- 5.3.1 Javascript 解析模块设计49-51
- 5.3.2 广告定位模块设计51-52
- 5.4 系统展示52-53
- 5.5 本章小结53-54
- 结论54-55
- 参考文献55-61
- 致谢61
【相似文献】
中国期刊全文数据库 前10条
1 李广洲,丁金芳,邓海山;基于Web的化学计算机化自适应测验系统的实现[J];计算机与应用化学;2002年05期
2 赵松林;基于Web服务的企业应用集成[J];微型机与应用;2003年08期
3 杜保华,刘弹,侯成刚,徐光华;XML WebService在基于Web远程分析工具集中的应用[J];仪器仪表用户;2004年02期
4 严毅,唐天兵,宁葵;Web服务实现开放式的企业应用集成[J];广西大学学报(自然科学版);2005年03期
5 邵文田;;去除使用Web服务寻找适当的程序项目[J];电脑迷;2007年15期
6 宋平;;基于Web服务的企业应用集成[J];福建电脑;2007年10期
7 邹丹;;基于Web服务的医院信息管理系统的设计与实现[J];大众科技;2007年06期
8 彭玉华;;基于Web的学生信息管理系统的设计与实现[J];民营科技;2010年09期
9 陈波;师惠忠;;一种新型Web应用安全漏洞统一描述语言[J];小型微型计算机系统;2011年10期
10 ;借会献技——国际软件博览会中心议题web计算及应用[J];每周电脑报;1997年43期
中国重要会议论文全文数据库 前10条
1 刘正涛;毛宇光;应毅;;基于Web服务的分布式Web应用框架研究[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
2 戴琦;;Web上的数据挖掘[A];全国计算机网络应用年会论文集(2001)[C];2001年
3 王卫;;基于Web的数据库应用[A];第十八届中国(天津)’2004IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2004年
4 张默;廖湖声;杜金莲;;基于Web服务的开放式地理信息系统的研究[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
5 郑菊艳;续爱民;;基于WEB模式的科研项目管理系统的设计与实现[A];第十四届中国科协年会第5分会场:绿色船舶与海洋装备创新发展及产业化论坛论文集[C];2012年
6 郑菊艳;续爱民;;基于WEB模式的科研项目管理系统的设计与实现[A];2012年MIS/S&A学术交流会议论文集[C];2012年
7 李勤;;基于WEB的计算机模拟病例考试系统在全科医师培训实践能力测试中应用研究[A];2012年浙江省全科医学学术年会论文汇编[C];2012年
8 黄海林;孙向阳;;基于Web的大学物理试题管理系统的设计[A];湖北省物理学会、武汉物理学会成立70周年庆典暨2002年学术年会论文集[C];2002年
9 于莉莉;张毅;;基于Web的人力资源管理系统研究与设计[A];2008全国制造业信息化标准化论坛论文集[C];2008年
10 李中华;;企业Web应用安全威胁与防护[A];创新·融合·发展——创新型煤炭企业发展与信息化高峰论坛论文集[C];2010年
中国重要报纸全文数据库 前10条
1 本报记者 刘继安;准备好了吗?WEB教师[N];中国教育报;2001年
2 张承东;Web智能考核广告[N];网络世界;2009年
3 科讯;WEB教师——一个全新职业的透析[N];科技日报;2001年
4 王雅丽;博客社区齐上阵 银行借Web 2.0拉拢未来客户[N];中国计算机报;2008年
5 本报记者 黄智军;Web应用呼唤新型安全系统[N];计算机世界;2009年
6 居易;WEB教师热门起来[N];组织人事报;2001年
7 本报记者 赵晓涛;四问“Web防御与云安全”[N];网络世界;2008年
8 本报记者 徐恒;手机浏览器:竞争不断加剧 Web大势所趋[N];中国电子报;2009年
9 电脑商报记者 张戈;Web应用安全正当时[N];电脑商报;2010年
10 李晨;Web应用安全应贯穿生命周期[N];人民邮电;2009年
中国博士学位论文全文数据库 前10条
1 孙慧峰;基于协同过滤的个性化Web推荐[D];北京邮电大学;2012年
2 何儒汉;Web图像的多模融合检索研究[D];华中科技大学;2007年
3 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
4 龙慧云;基于进程代数的Web服务数据和组合的形式化方法研究[D];贵州大学;2009年
5 孙涛;面向市场情报分析的Web实体事件融合问题研究[D];山东大学;2014年
6 谢琪;基于协同过滤与QoS的个性化Web服务推荐研究[D];重庆大学;2012年
7 刘方方;Web服务合成与可用性的若干关键技术研究[D];复旦大学;2007年
8 刘晓光;网络化制造中Web服务自动组合的若干关键技术研究[D];上海交通大学;2008年
9 刘国奇;面向领域QoS约束的Web服务选取方法[D];东北大学;2011年
10 李杰;基于服务质量的Web服务模型及应用研究[D];中国科学院研究生院(计算技术研究所);2005年
中国硕士学位论文全文数据库 前10条
1 李林蓉;基于Restful和OSGI的Web应用转换容器的研究与实现[D];华南理工大学;2015年
2 陈彬彬;基于QoS随机性的Web服务质量偏离监测方法研究与实现[D];昆明理工大学;2015年
3 徐超;机顶盒中基于Web交互方式的设计与实现[D];西南交通大学;2015年
4 张锐;基于Web技术下的出差管理系统[D];西安工业大学;2015年
5 游维;基于Rest的Web业务系统日志采集与分析系统的研究与开发[D];山东大学;2015年
6 陶莹昌;基于Web的校园二手图书拍卖平台的设计与实现[D];西华师范大学;2015年
7 周赢;基于WEB的绩效管理系统的设计与实现[D];电子科技大学;2015年
8 宋平亮;基于MongoDB的航道数据Web服务研究[D];大连海事大学;2015年
9 汪洋;基于web的普通话新闻检索技术研究[D];电子科技大学;2014年
10 吴朝云;基于eyeOS的Web操作系统云存储研究[D];电子科技大学;2014年
本文关键词:动态Web广告的智能获取技术研究,由笔耕文化传播整理发布。
本文编号:417375
本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/417375.html