基于Hadoop平台的数据迁移系统的设计与实现
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图2-1数据迁移系统流程图(Teradata到Hadoop)??
?山东大学硕士学位论文???主要功能和流程如图2-1。??r ̄^?r ̄^????????????????>????Tijaia?-?数据抽取+数据溝洗—数賺数雛验?数据臓—?Hado叩??数据库?|丨?[__?1丨?平台???数鮰传???图2-1数据迁移系统流程图(Teradat....
图2-2系统业务架构图??本系统研究的重点是把Teradata中的部分数据迁移至Hadoop,需要特别注??意的是系统连接和文件读取
?山东大学硕士学位论文???2.4系统业务流程分析??结合企业现有系统的实际情况,本系统的处理流程分为三个域:源数据域、??数据处理域、目标数据域,具体架构如图2-2所示。源数据域是指待迁移数据??所在的业务系统,在本文中具体是指Teradata数据库中的接口详单表、中间汇??总....
图3-2?MapReduce数据处理流程图??(1)?Ma阶段运行开始前,计算文件数量并进行分片,每个分片对应于一??
源。??3丄2?MapReduce数据处理流程??MapReduce是一种编程范式,使应用程序不需要进行复杂的分布式编程便??可以在分布式系统上执行。可以将MapReduce理解为根据某些特征对无序数据??进行归纳汇总,然后按需求进行处理以获得最终结果。Map阶段的任务主要是??....
图3-3?Hive数据仓库架构图??用户接口:最常见的用户接口是Cli,它通过命令行方式访问Hive,启动时会??在Hive中生成一个副本
?山东大学硕士学位论文???用户接口??(、Shell/CLI?j?I^IDBC客户端?j?l〇DB客户端^?(?WEI接口?^??\?'Zff?乂」??Thrift?服务器?Z??\?(?解析器?)?、/????(?编译器?)?、??(?^元数据库??(执行器)?^??w??J....
本文编号:3991981
本文链接:https://www.wllwen.com/shoufeilunwen/xixikjs/3991981.html