当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于大数据的网络广告推送服务研究

发布时间:2017-05-07 09:04

  本文关键词:基于大数据的网络广告推送服务研究,,由笔耕文化传播整理发布。


【摘要】:近年来,随着互联网的迅猛发展以及大数据时代的来临,传统互联网广告投放的粗放性和无目标性弊端越来越明显,使得市场对精准互联网广告的需求变得十分迫切。于是在此背景下诞生了一种新的广告模式—大数据环境下的网络定向广告,即通过一定的技术将广告定向推送给目标用户。而以定向广告为核心的网络广告推送服务也随之而来,虽然学术界目前对其已经取得了一些研究成果,但广告与目标用户失配的情况依然大量存在,如何有效提高推送服务中广告与目标用户匹配的准确度成了一个迫切需要解决的问题。 广告与目标用户准确匹配的一个关键在于准确地分析出用户的兴趣点,进而才能向其投放与之兴趣吻合的广告。数据管理平台(DMP)是一个用户数据分析平台,也是整个网络广告推送服务体系的核心,其主要功能是分析出用户的上网兴趣特征。论文将目光集中在该平台中的行为定向广告模块,对其中用户行为特征分析所涉及的一些技术进行了认真研究,包括网页特征词提取技术、相似网页聚合方法、用户行为分析算法等,随后提出在原有相似网页聚合方法的基础上融入一种基于Redis的网页类别判定方法,形成一个旨在提高相似网页聚合准确性的优化策略。其准确性越好,分析出的用户兴趣越精确。该优化策略首先搜集各热门行业的词汇及其行业类别属性,统一建模,建立Redis知识库,然后依据该知识库以及相关判定算法实现对网页特征词的行业类别判定,之后综合所有特征词的行业类别并通过权重值计算得出网页的行业类别,最后将其与原相似网页聚合中用到的向量空间模型和聚类算法等结合,重新定义聚合标准,进而达到提高相似网页聚合准确性的目的。之后又参考该优化策略,将基于Redis的网页类别判定融入到用户兴趣与广告匹配的过程中,同样改善了广告与目标用户的匹配效果。 最后,论文设计并实现了数据管理平台子模块,并选取北京交通大学信息中心部分网络日志作为数据源,以网页相似性聚合准确率和召回率、广告匹配准确率和召回率作为评价指标,分别对优化前后的相似网页聚合效果以及优化前后广告匹配效果进行对比分析,之后得出优化后的四个评价指标在一定程度上都有相应提高,最终验证了论文提出的优化方法对提高相似网页聚合准确性以及广告与目标用户匹配的准确度有所帮助。
【关键词】:定向广告匹配 行为特征分析 相似网页聚合 网页类别判定 Redis
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP311.52
【目录】:
  • 致谢5-6
  • 摘要6-7
  • ABSTRACT7-12
  • 1 引言12-21
  • 1.1 选题背景和意义12-15
  • 1.1.1 互联网发展现状12-13
  • 1.1.2 联网广告13-15
  • 1.1.3 研究意义15
  • 1.2 研究现状15-19
  • 1.2.1 网络定向广告推送服务平台15-16
  • 1.2.2 网络定向广告种类16-17
  • 1.2.3 网络定向广告投放技术17-19
  • 1.3 研究内容与目标19
  • 1.4 论文组织结构19-21
  • 2 网络定向广告推送服务体系21-30
  • 2.1 网络定向广告推送服务功能架构21-22
  • 2.2 数据管理平台22-26
  • 2.2.1 用户上网数据预处理23-24
  • 2.2.2 用户行为特征分析24-26
  • 2.2.3 数据更新26
  • 2.3 需求方平台26-29
  • 2.3.1 广告计价模式27-28
  • 2.3.2 实时竞价(RTB)28-29
  • 2.4 本章小结29-30
  • 3 用户行为特征分析关键技术30-40
  • 3.1 Hadoop平台30-32
  • 3.1.1 Mapreduce并行计算框架30-31
  • 3.1.2 HDFS分布式文件系统31-32
  • 3.2 基于jsoup的HTML解析方法32-33
  • 3.3 向量空间模型33-35
  • 3.4 聚类算法35-37
  • 3.5 用户行为分析算法37-39
  • 3.5.1 特征新鲜度37-38
  • 3.5.2 特征离散度38-39
  • 3.5.3 离散因子39
  • 3.6 本章小结39-40
  • 4 用户行为特征分析相关技术优化40-52
  • 4.1 基于Redis的网页类别判定40-49
  • 4.1.1 Redis简介41-43
  • 4.1.2 设计方案概述43-44
  • 4.1.3 知识库的建立44-46
  • 4.1.4 网页类别判定的实现46-49
  • 4.2 相似网页聚合优化49-51
  • 4.3 本章小结51-52
  • 5 数据管理平台子模块的实现52-61
  • 5.1 概要设计52-53
  • 5.2 Hadoop平台搭建53-55
  • 5.3 功能模块实现55-60
  • 5.3.1 数据预处理55-56
  • 5.3.2 网页特征词提取56-57
  • 5.3.3 相似网页聚合57-59
  • 5.3.5 行为特征分析59-60
  • 5.4 本章小结60-61
  • 6 实验结果及分析61-68
  • 6.1 实验数据选取61
  • 6.2 实验评价指标61-62
  • 6.3 实验结果分析62-67
  • 6.4 本章小结67-68
  • 7 总结与展望68-70
  • 7.1 工作总结68
  • 7.2 未来工作与展望68-70
  • 参考文献70-72
  • 作者简介及攻读硕士学位期间取得的研究成果72-74
  • 学位论文数据集#@@

【参考文献】

中国期刊全文数据库 前8条

1 王中华;;网络广告模式现存问题及解决思路探讨[J];经济研究导刊;2010年01期

2 刘迁;贾惠波;;中文信息处理中自动分词技术的研究与展望[J];计算机工程与应用;2006年03期

3 熊文新;宋柔;;信息检索用户查询语句的停用词过滤[J];计算机工程;2007年06期

4 施聪莺;徐朝军;杨晓江;;TFIDF算法研究综述[J];计算机应用;2009年S1期

5 俞淑平;陈刚;;一种高效的行为定向广告投放算法[J];计算机应用与软件;2011年01期

6 沈维梅;;网络精准广告的发展及困惑[J];新闻界;2010年01期

7 宫学庆;王立;何晓丰;;基于用户分组的广告定位(英文)[J];华东师范大学学报(自然科学版);2013年03期

8 谢桂兰;罗省贤;;基于Hadoop MapReduce模型的应用研究[J];微型机与应用;2010年08期


  本文关键词:基于大数据的网络广告推送服务研究,由笔耕文化传播整理发布。



本文编号:349549

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/349549.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户547ca***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com