当前位置:主页 > 文艺论文 > 广告艺术论文 >

基于用户兴趣的协同过滤算法的广告推荐研究

发布时间:2017-04-04 11:06

  本文关键词:基于用户兴趣的协同过滤算法的广告推荐研究,由笔耕文化传播整理发布。


【摘要】:互联网科技发展迅猛,互联网信息繁杂,如何针对特定兴趣的用户投放相关广告,提高广告回报率是目前学术界及商界关注的焦点。本文首先分析挖掘某大学城交友网站用户网络行为,然后改进协同过滤算法的预测和推荐机制,依据协同过滤算法预测用户兴趣及广告投放模式,并对其二者建立映射关系,从而达到针对具体用户投放更为精准广告的目的。 本文研究工作主要包括数据获取与分析、用户兴趣模式提取、协同过滤算法改进和广告推荐验证。 为使用户兴趣提取更精准,数据获取与分析是关键。本文的数据源采用静态和动态两部分;静态数据来自某大学城交友网站的注册信息,为保证静态数据的可读性,采用数据降噪技术,剔除无效字符、符号、语气词等;动态数据主要来自于网站后台记录的用户行为日志以及通过设计自适应含网页相似度多线程主题网络爬虫爬取的网页数据并进行分词,采用基于有向无环图(DAG)和动态规划最大概率提高分词精准度,采用压缩Trie树结构存储分词便于词语匹配,提高用户兴趣模式提取的效率。 用户的兴趣模式提取工作分别从静态数据和动态数据出发,基于静态数据的规则性,使用N叉树结构的点存储处理后的静态数据,叶节点的父节点以及其它所有的非叶节点中存储进一步抽象化兴趣信息,利用关系树查找算法计算用户的兴趣属于N叉树中的哪一类兴趣集以初步提取用户的兴趣。动态数据部分在经过数据分析阶段的一系列处理后采用基于词频的策略提取用户的兴趣。 本文在协同过滤算法的预测阶段,为了使预测结果更加精准,在预测阶段加入了用户兴趣模式,而不是简单的通过用户在本体网站的点击记录来预测用户对广告的点击率。采用回归的预测值计算方式来消除用户打分的惯性行为对预测结果准确性的影响。通过使协同过滤算法预测阶段数据源多元化,提高了算法就预测用户点击广告的精准度。 针对以上的所有研究分析工作,编写了网络爬虫软件以及推荐系统,且将推荐系统应用于某某大学城交友网站上。实验证明,本论文的网络爬虫软件较其他常规爬虫软件具有较高的性能,爬取的网页与用户的关联度较大;推荐系统推荐的商品与用户的兴趣较为接近。
【关键词】:聚类 协同过滤算法 Trie树 N叉树
【学位授予单位】:昆明理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.13
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 第一章 绪论10-16
  • 1.1 研究背景和意义10-12
  • 1.2 国内外研究现状综述12-14
  • 1.3 本文主要工作14-15
  • 1.4 本文的结构15-16
  • 第二章 数据挖掘及存储相关背景知识16-24
  • 2.1 数据挖掘以及Web数据挖掘基础知识16-19
  • 2.1.1 数据挖掘16-17
  • 2.1.2 Web数据挖掘17-19
  • 2.2 N叉树介绍19-20
  • 2.3 MongoDB 的介绍20-22
  • 2.4 本章小结22-24
  • 第三章 用于兴趣提取的数据源获取24-40
  • 3.1 静态数据获取24-25
  • 3.2 动态数据获取25-38
  • 3.2.1 动态数据特点25-29
  • 3.2.2 主题爬虫29-31
  • 3.2.3 多线程主题爬虫算法31-35
  • 3.2.4 多线程主题爬虫仿真结果35-38
  • 3.3 本章小结38-40
  • 第四章 用于兴趣提取的数据源处理40-56
  • 4.1 静态数据处理40-44
  • 4.1.1 数据在MongoDB存储策略40-41
  • 4.1.2 关系查找树算法在静态数据的研究41-44
  • 4.2 动态数据处理44-54
  • 4.2.1 Trie树组织语料库44-47
  • 4.2.2 Trie树结构改进47-49
  • 4.2.3 改进Trie树仿真49
  • 4.2.4 动态数据分词49-53
  • 4.2.5 分词仿真53-54
  • 4.3 本章小结54-56
  • 第五章 兴趣提取56-60
  • 5.1 兴趣提取策略56-57
  • 5.2 兴趣提取流程57-58
  • 5.3 兴趣提取仿真58
  • 5.4 本章小结58-60
  • 第六章 改进协同过滤算法在广告推荐中的应用60-70
  • 6.1 协同过滤算法60-62
  • 6.1.1 基于用户的协同过滤算法60-61
  • 6.1.2 基于物品的协同过滤算法61-62
  • 6.2 改进协同过滤算法62-66
  • 6.2.1 算法改进思想62-64
  • 6.2.2 算法改进实现64-66
  • 6.3 改进的算法在交友网的广告推荐应用66-70
  • 6.3.1 交友网的设计67
  • 6.3.2 算法在交友网的广告推荐应用67-70
  • 第七章 总结与展望70-72
  • 致谢72-74
  • 参考文献74-78
  • 附录A 硕士期间发表的论文专利及软著78-80
  • 附录B 硕士期间参与项目80

【参考文献】

中国期刊全文数据库 前10条

1 朱聪慧;赵铁军;郑德权;;基于无向图序列标注模型的中文分词词性标注一体化系统[J];电子与信息学报;2010年03期

2 张卫丰,徐宝文;Web搜索引擎框架研究[J];计算机研究与发展;2000年03期

3 汪涛,樊孝忠;主题爬虫的设计与实现[J];计算机应用;2004年S1期

4 曾小波;魏祖宽;金在弘;;协同过滤系统的矩阵稀疏性问题的研究[J];计算机应用;2010年04期

5 王伯槐;李红卫;刘黎;;基于n-叉树实现桶排序算法[J];科学技术与工程;2009年14期

6 王石;曹存根;裴亚军;夏飞;;一种基于搭配的中文词汇语义相似度计算方法[J];中文信息学报;2013年01期

7 纪文迪;王晓玲;周傲英;;广告点击率估算技术综述[J];华东师范大学学报(自然科学版);2013年03期

8 宋杰;王大玲;鲍玉斌;申德荣;;基于页面Block的Web档案采集和存储[J];软件学报;2008年02期

9 赵东风,赵雪春;随机N叉树形冲突分解算法研究[J];云南大学学报(自然科学版);2000年01期

10 刘建国;周涛;汪秉宏;;个性化推荐系统的研究进展[J];自然科学进展;2009年01期


  本文关键词:基于用户兴趣的协同过滤算法的广告推荐研究,由笔耕文化传播整理发布。



本文编号:285408

资料下载
论文发表

本文链接:https://www.wllwen.com/wenyilunwen/guanggaoshejilunwen/285408.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户ae56a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com