基于互联网流量数据的用户行为与意图分析
发布时间:2019-07-04 08:57
【摘要】:经过多年的快速发展,我国的互联网用户数量有了大规模的夸张,中国的互联网环境也日渐成熟,其应用也不断从单一转变为多元。同时,随着互联网的发展,其对人们的影响也更加的深度和广泛,人们在互联网环境中留下的印记也越来越多,越来越丰富。在这样的背景下,我们正一步步在“大数据时代”走向深入,形成了海量的互联网用户数据。随着海量网络数据的膨胀,以往的数据处理方式已经不能满足所有的使用场景,而Hadoop处理平台的分布式处理框架为我们提供了一个很好的方式,已经成为海量互联网流量数据的处理中非常重要的高性能工具。同时,人们的每一个单独的行为都会产生网络数据,形成我们现实生活和虚拟网络环境交互的重要接口。面对这样庞大的数据量和不断变化的数据结构,如何整合并进行有效的分析,同时能更早更准确的判断人们行为发生的规律和意图将带来广阔的市场和机遇,也是本文中关注的重点。本文首先介绍了研究的主要内容和其目的与意义。从互联网用户行为的影响和意义的角度对其行为和意图进行了阐述,建立基本的认识。之后,从内容,方法和使用等多个角度对用户行为和意图分析进行了说明。然后,简要介绍了研究中用到的大数据处理平台Hadoop系统,对其框架和编程模型以及使用Hadoop系统进行初步数据处理的方式进行了说明。之后,本文着重介绍了研究中用到的几种重要的分析模型,分别是深度学习算法中的深度信念网络和高效成熟的支持向量机模型以及在中文文本处理中使用到的TF-IDF算法。并对这几种模型的训练方式进行了说明。然后本文重点阐述了使用分析模型对用户行为和意图进行分析的过程和得到的实验结果,得到了两个成熟准确的预测模型,分别为用户点击行为的预测分析和用户搜索意图的分析提供了数据支持和说明。最后,本文总结了分析中显现的优势和发现的问题,并对未来更加深入的分析研究进行了展望。
[Abstract]:......
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.0;TP311.13
本文编号:2509799
[Abstract]:......
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP393.0;TP311.13
【参考文献】
相关期刊论文 前1条
1 江雪;孙乐;;用户查询意图切分的研究[J];计算机学报;2013年03期
相关博士学位论文 前1条
1 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
,本文编号:2509799
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2509799.html