当前位置:主页 > 科技论文 > 软件论文 >

基于大数据技术的网络信息分析研究

发布时间:2019-11-02 08:46
【摘要】:近年来,通信技术和互联网技术飞速发展,人们对社会化媒体的使用也随之骤增,网络产生的数据越来越多。在这样的环境下,推荐系统作为一种有效解决数据过载问题的技术,得到了广泛的关注和研究。同时,大数据技术的成熟应用使得数据处理的速度大幅度提升。本文的研究课题正是基于推荐系统技术以及其与大数据技术的结合进行的。本文分析了课题的研究背景和国内外的研究现状,在对推荐系统技术的国内外研究做出调研总结之后,着重研究了基于邻域的协同过滤和基于模型的协同过滤推荐技术,在此基础上进行自己的改进和创新,提出了一种融合推荐算法。在只有评分数据的场景下,深度融合基于项目邻域的协同过滤算法KNNitem和基于矩阵降维模型的推荐算法RSVD,结合这两种算法的优点,从而同时考虑了局部相似度和全局相似度,提升了推荐算法的准确度。随后采用北邮人论坛的实际数据进行试验证明,改进的推荐算法具有更好的推荐效果。同时,本文针对大数据时代推荐系统的数据处理速度慢的问题,将推荐系统与大数据技术相结合,通过对开源的推荐系统的研究和分析,总结出基于大数据技术的个性化推荐系统的设计与实现方法,基于Mahout框架进行个性化推荐系统的构建。通过分层设计的模式对个性化推荐系统进行设计,阐述各层的功能和设计原理,随后通过程序的编写对系统进行实现。
【图文】:

架构图,架构,数据节点


S客户端的操作提供服务,所有的客户端请求先到达NameNode,然后educe框架进行处理。Map操作将文件分割成小数据块然后将它们分的数据节点以及备份节点,在需要从分布式文件系统中读取数据时,Re将各个节点的数据进行整合。对于每一个读操作,Reduce操作eNode的命名空间收集兀数据信息,而从每个数据节点收集数据信息,们一起呈现给客户端。逡逑DataNode是数据存储甘点,Hadoop的所有数据都存储在数据节点。S集群由一个主节点和许多数据节点组成。当用户需要在Hadoop上存文件时,大文件被拆分成不间的模块存储在一组数据节点上。NameNod据块的映射操作,间时存储相关的兀数据信息,为客户端的各种操作作指令来白NameNode。逡逑HDFS的所有组成部分都运行于Linux操作系统和廉价的普通机器上,DFS的实现变得十分简单和廉价。HDFS基于Java语言实现,,而Java,并且具有平台独立性,这使得HDFS容易被广泛接受。图2-1直观的DFS的架构组成。逡逑_/邋NameNode逡逑

机器,形式,框架,函数


value〉形式。然后reduce函数开始工作,输入为<key,(Iist邋of邋values)〉形式,逡逑对这个数据集进行处理后,每个reduce函数产生1个或0个输出,其形式为逡逑<key,value〉。MapReduce具体的数据处理过程如图2-2所不逡逑Input逦Mappers邋Middle邋Result逦Reducers逦Output逡逑「邋"1邋逦|邋;邋|逡逑SpIi'O逦-邋-I邋?邋Map()逦逦\^l逦!逦逦邋i邋逦邋!逡逑——| ̄?邋Reduce邋()——?邋partO逡逑Splitl邋-]-?邋Map0邋逦[?逦邋Y逦|逦!逡逑!邋逦邋|邋逦邋]邋逦yjj逦—| ̄ ̄?邋Reduce0邋邋K邋parti逡逑i邋Sp邋1邋i邋t2邋1邋?邋Map邋()邋逦逦/逦逦邋!逦'逡逑iii逦i逦1逦i逡逑i邋逦邋i邋逦邋i邋逦邋i逦i逦i逡逑?逦i逦i逦i逦!逦i逡逑图2-2邋MapReduce处理数据流程逡逑2.邋1.2邋Mahout邋介绍逡逑Mahout丨21丨足邋Apache邋Software邋Foundation邋(ASF)的开源项目之一,它足一个逡逑基于Hadoop的机器学>」和数据挖掘的分布式计算框架,运行于Hadoop系统之逡逑匕与Hadoop类似,它也基于Java编写而成。所以可以在任何运行JVM的平逡逑台h.进行使用。它提供了一个算法集来解决聚类、分类和预测等问题。它与逡逑Hadoop的MapReduce框架相结合,从而可以用一种廉价的解决方案g??解决机器逡逑学的H题。Mahout自出现以来
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP391.3;TP311.13

【参考文献】

相关期刊论文 前7条

1 胡晓彤;赵宗晓;;基于三维测量的奶牛体型性状指标的数据采集[J];天津科技大学学报;2011年03期

2 曾小波;魏祖宽;金在弘;;协同过滤系统的矩阵稀疏性问题的研究[J];计算机应用;2010年04期

3 刘建国;周涛;郭强;汪秉宏;;个性化推荐系统评价方法综述[J];复杂系统与复杂性科学;2009年03期

4 马宏伟;张光卫;李鹏;;协同过滤推荐算法综述[J];小型微型计算机系统;2009年07期

5 许海玲;吴潇;李晓东;阎保平;;互联网推荐系统比较研究[J];软件学报;2009年02期

6 刘建国;周涛;汪秉宏;;个性化推荐系统的研究进展[J];自然科学进展;2009年01期

7 程超;曹杰;;基于网格技术的电子商务平台研究[J];计算机与现代化;2007年11期



本文编号:2554399

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/2554399.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户dd071***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com