课程介绍:
本课程涵盖FusionInsight HD解决方案架构、设计、部署和维护,大数据常用组件技术原理、设计、部署、管理与维护(包括HDFS、MapReduce、Yarn、Saprk2x、Hbase、Hive、Streaming、Loader、Flume、Kafka、Zookeeper等)。
培训目标:
系统理解大数据架构、技术原理
掌握华为大数据FusionInsight HD方案
具备大数据平台的规划设计、部署和运维能力
熟悉HDFS、MapReduce、Yarn、Spark
熟悉HBase、Hive、Loader、Flume
熟悉Kafka、Streaming
熟悉ZooKeeper
课程大纲:
大数据行业与技术趋势
1. 大数据时代
2. 大数据的应用领域
3. 大数据时代的机遇和挑战
4. 华为大数据解决方案
HDFS分布式文件系统
1. HDFS概述及应用场景
2. HDFS在FusionInsight产品中的位置
3. HDFS系统架构
4. 关键特性介绍
MapReduce分布式离线批处理和Yarn资源协调
1. MapReduce与YARN基本介绍
2. MapReduce与ARN功能与架构
3. YARN的资源管理和任务调度
4. 增强特性
Spark基于内存的分布式计算框架
1. Spark概述
2. Spark原理与架构
3. Spark在FusionInsight中的集成情况
HBase分布式NoSQL数据库
1. Hbase基本介绍
2. Hbase功能与架构
3. Hbase关键流程
4. Hbase华为增强特性
Hive分布式数据仓库
1. Hive概述
2. Hive功能与架构
3. Hive基本操作
Streaming分布式流计算引擎
1. Streaming简介
2. 系统架构
3. 关键特性介绍
4. StreamSQL介绍
Flink流计算处理和批处理平台
1.Flink流计算处理和批处理平台
2.Flink概述
3.Flink原理与技术架构
4.Flink在FusionInsight HD中的集成情况
Loader数据转换
1. Loader简介
2. Loader作业管理
Flume海量日志聚合
1. Flume简介及架构
2. Flume关键特性介绍
3. Flume应用举例
Kafka分布式消息订阅系统
1. Kafka简介
2. Kafka架构与功能
3. Kafka关键流程
ZooKeeper集群分布式协调服务
1. Zookeeper简介
2. Zookeeper在产品中的位置
3. 系统架构
4. 关键特性介绍
5. 与组件的关系
FusionInsight HD解决方案介绍
1. FusionInsight概述
2. FusionInsight特性介绍
3. FusionInsight HD成功案例