2019Apache Hadoop管理员培训(9月北京班)

2019年09月21日 - 09月24日
北京
¥7360 起

会议介绍

【会议内容】

课程概述:
综合理解并全面掌握通过Cloudera Manager对Hadoop机群的运维管理,包括:安装,配置、负载平衡及性能调优等。通过该培训,Hadoop系统管理员将能准备好应对实际运维中遇到的挑战。


课时安排:

4天/24课时。


认证编号:
CCA131。通过并获取该证书是向公司及客户证明个人在Hadoop领域的技术和专长的有力依据。


培训内容:
通过讲师在课堂上的讲解,以及实操练习,学员将学习以下内容:
> Cloudera Manager管理机群的特性,譬如日志汇总、配置管理、报告、报警及服务管理。
> YARN、MapReduce、Spark及HDFS的工作原理。
> 如何为你的机群选取合适的硬件和架构。
> 如何将Hadoop机群和企业已有的系统进行无缝集成。
> 如何使用Flume进行实时数据采集以及如何使用Sqoop在RDBMS和Hadoop机群之间进行数据导入导出。
> 如何配置公平调度器为Hadoop上的多用户提供服务级别保障。
> 产品环境中Hadoop机群的最佳运维实践。
> Hadoop机群排错、诊断问题和性能调优。


培训对象及学员基础:
面向系统管理员和IT经理,需具备Linux经验,无需Apache Hadoop基础。


客户评价:

“Cloudera的Hadoop管理员培训让我快速并全面地掌握了我在解决客户所面临的大数据及云平台挑战时所需要的技能和知识,大量节省了时间!”
—— Canonical

【会议日程】

课程大纲

Apache Hadoop介绍
·Hadoop动机
·基本概念
·Hadoop核心部件

Hadoop机群安装
·机群管理方案
·Cloudera Manager特性
·Cloudera manager安装
·Hadoop(CDH)安装

Hadoop分布式文件系统(HDFS)
·HDFS特性
·读写文件
·NameNode内存考虑
·HDFS安全简介
·HDFS WebUI
·使用HDFS Shell

YARN上的MapReduce和Spark
·计算平台在Hadoop里扮演的角色
·YARN:机群资源管理器
·MapReduce概念
·Apache Spark概念
·Yarn上的计算平台
·YARN WebUI及Shell
·YARN应用运行日志

Hadoop 配置及服务运行日志
·Cloudera Manager 配置管理机制
·定位配置参数及进行配置变更
·管理角色实例及添加服务
·配置HDFS服务
·配置Hadoop服务运行日志
·配置YARN服务

向HDFS导入数据
·使用ume从外部数据源实时导入数据
·使用Sqoop从关系数据库导入数据
·REST接口
·导入数据的最佳实践

Hadoop机群规划
·规划考虑因素
·硬件选择
·虚拟化选项
·网络因素
·节点配置

Hive,Impala及Pig的安装及配置
·Hive
·Impala
·Pig

Hadoop 客户端及Hue
·什么是Hadoop客户端
·安装及配置Hadoop 客户端
·安装及配置 Hue
·使用Hue进行身份验证及授权

机群高级配置
·高级配置参数
·Hadoop端口配置
·HDFS机柜感知配置
·HDFS高可靠性配置

Hadoop安全
·Hadoop安全的重要性
·Hadoop安全性概念
·Kerberos简介
·使用Kerberos 保护Hadoop机群
·其他安全特性

资源管理
·使用静态服务池配置Linux qgroup
·公平调度器
·配置动态资源池
·YARN内存及CPU设置
·Impala查询调度

机群维护
·检查HDFS状态
·机群间复制数据
·添加/移除机群节点
·机群数据负载平衡
·目录快照
·机群升级

机群监控及排错
·Cloudera Manager监控特性
·监控Hadoop机群
·Hadoop机群排错
·常见配置不当问题

总结

【会议门票】

会务费:7360元/人,包含4天/24课时的课程,住宿交通与餐饮自理。

拟邀嘉宾

猜你喜欢