更新时间:2023-03-14 来源:黑马程序员 浏览量:
本套教程包含大数据必学的Hadoop、Hive,云平台实战项目,让零基础同学一站式入门,直通大数据核心技术,黑马2023新版《大数据入门到实战》教程,上线了!!!
赶快跟随播妞一起进入大数据领域,一起体验大规模数据计算的魅力吧。基于零基础学习的内容设计,提供了丰富的补充知识点供零基础学员进行前置学习。
作为2023年黑马程序员全新的大数据入门课程,课程内容采用全新的技术栈体系。基于Hadoop3.3.4、Hive 3.1.3、阿里云和UCloud云平台,为同学们打造一门大数据Hadoop生态体系的入门课程,但又不仅仅只Hadoop。
课程特色
• 理论+实战完美结合:本套教程采用“理论+实战”的形式,全面介绍了大数据Hadoop、Hive离线开发的相关知识;
• 有内容也有深度:课程采用“入门+提高”的内容设计,入门知识和高阶知识相互独立,先全面入门,后全面进阶,循序渐进让大家学有所成;
• 结合当下热门的云平台(阿里云、UCloud)为大家带来《云原生大数据开发》:基于Hadoop3.3.4、Hive 3.1.3、阿里云和UCloud云平台,采用全新的技术栈体系。
适合人群
>零基础:小白入门到高阶,再到精通
>进阶者:有经验的工程师巩固拓展
>探索者:感兴趣者领略大数据魅力
课程目录
01 第一章 Hello大数据&分布式
* 对大数据、分布式有基础的认知,了解大数据的诞生、作用
* 对大数据的技术体系进行入门认知,了解大数据技术体系的各类技术框架
* 对Apache Hadoop有基本的认知,了解Hadoop的发展和作用
* 了解分布式系统的基础架构
* 掌握HDFS的基本架构
* 完成HDFS集群环境的部署
* 学习HDFS系统的shell命令
* 对HDFS系统的运行原理进行深入学习
03 第三章 MapReduce & YARN 入门
* 了解分布式计算的基本概念
* 认知MapReduce分布式计算框架
* 认知YARN分布式资源调度框架
* 掌握YARN的基本架构
* 完成MapReduce & YARN集群的部署
* 在部署集群内完成MapReduce和YARN的初体验
04 第四章 分布式SQL计算 Hive入门
* 了解Apache Hive的作用
* 以抽象视角讨论如何实现分布式SQL计算
* Hive基础架构分析
* 部署Hive
* Hive初体验,完成使用Hive进行分布式的SQL计算
* 掌握各类Hive客户端的使用
* 掌握Hive数据库的相关操作语法
* 掌握Hive数据表的相关操作语法(内部表、外部表、修改表、分区表、分桶表等)
* 掌握Hive数据查询的相关操作语法(基本查询、UNION、虚拟列、数据抽样、RLINK正则)
* 掌握Hive常用的内置函数
* 完成Hive综合案例开发(数据统计、BI可视化展现)
* MapReduce执行原理分析
* Hive的各类排序
* Hive的数据压缩
* Hive的各类数据存储(ORC、列存储)
* Hive调优(MapJoin、BucketMapJoin、动态分区、数据倾斜等)
* YARN的队列和调度器分析
* HDFS HA分析
* Hadoop集群调优
* 掌握云原生大数据的各类组件(DataWorks、MaxComputer等)
* 基于云原生组件进行大数据实战案例的开发
# 配套资源领取方式 #
PPT+md笔记+Xmind梳理
+工具+源码+实战项目
点击跳转课程页,就等你来领取啦