基于Hadoop平台的医疗康复推荐系统的研究与实现
【图文】:
江 苏 大 学 硕 士 学 位 论 文第二章 系统相关技术及问题分析2.1 Hadoop 平台简介Hadoop 是一个分布式系统开源框架,它的想法来自于 Google 的两篇学术论文,分别为 MapReduce 和 Google File System。Hadoop 支持在计算机集群上面分布式处理简单的编程模型。集群中的每一台机器都可以在本地进行计算和数据的存储。Hadoop 由很多元素组成,最底层是 Hadoop 分布式文件系统HDFS(Hadoop Distributed File System),它主要负责储存集群上面所有节点的文 件[11]。 在 HDFS 的 上 一 层 是 MapRduce 引 擎 , 是 由 JobTrackers 和TaskTrackers 这两个模块组成。再往上面一层是数据仓库工具 Hive 和分布式数据库 HBase。Hadoop 集群的生态圈如图 2.1所示。
一些概念进行介绍:1) 行:每一行代表着一个数据对象,由行键来唯一标识,行键以字符串的形式存在,而且所有的行都是按照行键的字典序进行排序存储的,按照行键排序可以获得像关系型数据库主键索引一样的特性[13]。2) 列:由列族和列限定符共同组成。列族需要在表创建时就定义好,列族里面包含了表中所有的列数据,列族确定以后不能修改,会影响 Hbase 的物理存储结构。表中的每行可以有相同的列族,但是每一行的列族不一定都有相同的列标识,也就是说每行只存储内容不为空的数据,这是一种稀疏的表结构,可以一定程度上避免数据的冗余。3) 单元格:每一个单元由列族和列标识组成,单元格中存储的是单元数据。从物理上,列式存储数据库聚合数据的时候是以列为单位,然后将列值依次存入磁盘,而行式存储数据库则是以连续地的方式存储整行。可以从 Hbase的集群架构图如 2.2所示。
【学位授予单位】:江苏大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:TP391.3;R496
【参考文献】
相关期刊论文 前7条
1 赵伟;李俊锋;韩英;张红涛;;Hadoop云平台下的基于用户协同过滤算法研究[J];计算机测量与控制;2015年06期
2 廖湘庆;杨松;罗丽群;张黔;;基于云平台的公立医院延伸医疗服务新模式的探索[J];中国医院管理;2013年12期
3 王道平;李秀雅;杨岑;;基于内容相似度的知识协同过滤推送算法研究[J];情报理论与实践;2013年10期
4 路永和;李焰锋;;改进TF-IDF算法的文本特征项权值计算方法[J];图书情报工作;2013年03期
5 黄承慧;印鉴;侯f ;;一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J];计算机学报;2011年05期
6 李曼;王琰;赵益宇;杜小勇;王珊;;基于关系数据库的大规模本体的存储模式研究[J];华中科技大学学报(自然科学版);2005年S1期
7 原福永,杨桂芝,程玉良;基于Agent的个性化信息服务系统的开发与设计[J];计算机工程与应用;2004年33期
相关博士学位论文 前4条
1 张琳;电子商务网站个性化推荐的多样性对推荐效果的影响研究[D];北京邮电大学;2017年
2 肖延辉;基于矩阵分解的图像表示理论及其应用研究[D];北京交通大学;2014年
3 孔维梁;协同过滤推荐系统关键问题研究[D];华中师范大学;2013年
4 付畅俭;基于内容的视频结构挖掘方法研究[D];国防科学技术大学;2008年
相关硕士学位论文 前10条
1 孟天宏;基于词嵌入的个性化推荐系统的研究[D];河北科技大学;2018年
2 陈中华;基于数据挖掘的图书推荐系统设计与实现[D];湖南大学;2018年
3 乐己扬;完善宁波工伤康复服务体系研究[D];宁波大学;2017年
4 张炫铤;基于HBase的矢量空间数据存取关键技术研究[D];江西理工大学;2017年
5 张瑞;基于慢性病轨迹的我国慢性病干预研究[D];南京大学;2017年
6 王冬晖;基于内容的计算机科学论文推荐系统设计与实现[D];吉林大学;2017年
7 唐丽娜;Y康复医疗机构发展战略研究[D];昆明理工大学;2017年
8 侯瑞敏;基于SSM的电力设备管理系统的设计与实现[D];华北电力大学;2017年
9 李帅力;基于SpringMVC及MyBatis框架的智慧园区访客管理系统的设计与实现[D];浙江工业大学;2016年
10 梅红泉;基于HBase的工业物联网数据存储策略研究[D];华中科技大学;2016年
,本文编号:2602728
本文链接:https://www.wllwen.com/linchuangyixuelunwen/2602728.html