课程长度:4天/24小时
课程描述:
本次课程从基础理论出发,结合一线实战经验,从开发(DEV),运维(OPS),数据库管理(DBA)三方面对HADOOP进行由浅入深的讲解。能够让学员结合自身特点,有的放矢。在理解Hadoop系统适用场景,搭建稳定可靠的Hadoop集群,满足生产环境的前提下,掌握MapReduce与Hive的中高级数据开发技能,HDFS管理技能和HBASE(NOSQL)数据库的管理技能。
学员基础:
1.计算机相关专业
2.具备基本Linux系统管理经验
3具备编程经验的开发人员
4.熟悉Java
5.不需要事先掌握Hadoop相关知识。
培训目标:
·对于有开发经验的学员,*对MAPREDUCE计算模型和数据流的讲解,能快速的适应在HADOOP集群上进行数据开发相关工作。
·对于有运维经验的学员,*对HDFS文件系统和HADOOP集群维护管理的讲解,能快速适应企业的HADOOP集群维护工作。
·对于有数据库管理经验的学员,*对HBASE的讲解,加深对NOSQL产品的理解,能快速适应大数据下的数据库管理工作。
培训内容:
*部分:Hadoop简介
一、初识Hadoop
·数据存储和分析
·传统RDBMS和HADOOP应用场景和区别
·Hadoop项目及其结构
·Hadoop单点安装VMware,ubuntu,Java,Hadoop
第二部分:开发人员DEV 课程
二.初级MapReduce,Hadoop平台数据开发人员基础课程
·Hadoop Eclipse开发环境配置
·理解mapReduce计算模型
·分布式下MapReduce作业的执行过程
·WordCount实例讲解及数据流分析