大数据之Hadoo简介
试看:
更多视频请下载完整版hadoop
Hadoop框架主要用来解决海量数据的存储和分析计算问题。是大数据开发工程师必备技术之一。
课程特点:
全程案例贯穿始终,几乎每个知识点都有配套的案例;
整个框架深入源码讲解;
优化措施全部来源于企业开发;
Hadoop相关企业真题全覆盖。
本课程中你将学习到,Hadoop完全分布式集群搭建、Hadoop源码编译、HDFS的Shell操作、HDFS的API操作、HDFS的IO流操作、HDFS读写数据流程、NameNode和SecondaryNameNode工作机制、DataNode工作机制、集群节点动态服役和退役、HDFS2.x新特性、MapReduce编程规范、自定义序列化、自定义InputFormat、自定义OutputFormat、分区、排序、合并、分组、ReduceJoin、MapJoin、数据清洗、计数器、TopN案例、倒排索引案例、MapTask工作机制、ReduceTask工作机制、Shuffle工作机制、MapReduce工作流程、Job提交流程源码、MapReduce源码、数据压缩、Yarn工作机制、作业提交流程、YARN资源调度器、MapReduce企业优化、HDFS小文件企业优化、数据倾斜优化等。
视频课程
01_课程简介_大数据课程
02_课程简介_Hadoop课程
03_入门_大数据概念
05_入门_大数据应用场景
06_入门_大数据发展前景
07_入门_大数据部门业务流程分析
08_入门_大数据部门组织结构(重点)
09_Hadoop_是什么
10_Hadoop_发展历史
11_Hadoop_三大发行版本
13_Hadoop_1.x和2.x区别
14_Hadoop_组成
15_Hadoop_大数据技术生态体系
16_Hadoop_推荐系统框架图
17_环境搭建_虚拟机准备
18_环境搭建_JDK安装
19_环境搭建_Hadoop安装
20_环境搭建_Hadoop目录结构
21_环境搭建_Hadoop官网手册
22_本地模式_Grep官方案例
23_本地模式_WordCount官方案例
24_伪分布式_启动HDFS并运行MR程序
25_伪分布式_Log日志查看和NN格式化前强调
26_伪分布式_NameNode格式化注意事项
27_伪分布式_启动YARN并运行MR程序
28_伪分布式_配置历史服务器
29_伪分布式_配置日志聚集
30_伪分布式_配置文件说明
31_完全分布式_虚拟机环境准备
32_完全分布式_scp案例
33_完全分布式_rsync案例
34_完全分布式_集群分发脚本xsync
35_完全分布式_集群配置
36_完全分布式_集群单节点启动
37_完全分布式_集群ssh配置
38_完全分布式_集群群起
39_完全分布式_集群文件存储路径说明
40_完全分布式_集群启动停止方式总结
41_每日回顾
42_完全分布式_RM启动注意事项
43_完全分布式_Crondtab定时任务调度
44_完全分布式_集群时间同步
04_入门_大数据特点(4V)
45_Hadoop源码编译_意义
46_Hadoop源码编译_说明
47_Hadoop源码编译_具体流程
48_HDFS_课程介绍
49_HDFS_产生背景及定义
50_HDFS_优缺点
51_HDFS_组成架构
52_HDFS_块的大小设置
53_HDFS_Shell命令(开发重点)
54_HDFS_副本数设置
55_HDFS_客户端环境准备
56_HDFS_客户端环境测试
57_每日回顾
58_HDFS_文件上传_案例
59_HDFS_参数优先级说明_案例
60_HDFS_文件下载_案例
61_HDFS_文件夹删除_案例
62_HDFS_修改文件的名称_案例
63_HDFS_查看文件的详情_案例
64_HDFS_判断是文件还是文件夹_案例
65_HDFS_文件IO流上传_案例
66_HDFS_文件IO流下载操作_案例
67_HDFS_定位读取文件_案例
68_HDFS_写数据流程(面试重点)
69_HDFS_网络拓扑-节点距离计算
70_HDFS_机架感知-副本存储节点选择
71_HDFS_读数据流程(面试重点)
72_HDFS_NN和2NN工作机制(面试重点)
73_HDFS_Fsimage和Edits解析
74_HDFS_CheckPoint时间设置
75_HDFS_NN故障处理_案例
76_HDFS_安全模式
77_HDFS_集群安全模式_案例
78_HDFS_NN多目录配置_案例
79_每日回顾
80_HDFS_DN工作机制(面试重点)
81_HDFS_数据完整性
82_HDFS_掉线时限参数设置
83_HDFS_服役新节点_案例
84_HDFS_添加白名单_案例
85_HDFS_黑名单退役_案例
86_HDFS_DN多目录配置_案例
87_HDFS新特性_集群间数据拷贝
88_HDFS新特性_小文件归档案例
89_HDFS新特性_回收站案例
90_HDFS新特性_快照管理
91_MapReduce_课程介绍
92_MapReduce_概述
93_MapReduce_优缺点
94_MapReduce_核心思想
95_MapReduce_进程
96_MapReduce_官方案例源码解析和数据类型
97_MapReduce_编程规范
98_MapReduce_WordCount案例分析
99_MapReduce_WordCount案例Mapper
100_MapReduce_WordCount案例Reducer
101_MapReduce_WordCount案例Driver
102_MapReduce_WordCount案例测试
103_MapReduce_WordCount案例Debug调试
104_MapReduce_WordCount案例在集群上运行
105_每日回顾
106_MapReduce_序列化概述
107_MapReduce_序列化自定义步骤
108_MapReduce_序列化案例分析
109_MapReduce_序列化案例FlowBean
110_MapReduce_序列化案例Mapper
111_MapReduce_序列化案例Reducer
112_MapReduce_序列化案例Driver
113_MapReduce_序列化案例Debug调试
114_MapReduce_切片和MapTask并行度决定机制
115_MapReduce_Job提交流程源码解析
116_MapReduce_Job切片机制源码解析
117_MapReduce_FileInputFormat切片机制和配置参数
118_MapReduce_CombineTextInputFormat理论
119_MapReduce_CombineTextInputFormat案例
120_MapReduce_FileInputFormat实现类
121_MapReduce_TextInputFormat实现类
122_每日回顾
123_MapReduce_KeyValueTextInputFormat案例分析
12_Hadoop_优势(4高)
124_MapReduce_KeyValueTextInputFormat案例实现
125_MapReduce_NLineInputFormat案例分析
126_MapReduce_NLineInputFormat案例实现
127_MapReduce_自定义InputFormat步骤
128_MapReduce_自定义InputFormat案例
129_MapReduce_自定义InputFormat案例Debug
130_MapReduce_InputFormat实现类总结
131_MapReduce_工作流程(面试重点)
132_MapReduce_Shuffle机制(面试重点)
133_MapReduce_HashPartition默认分区
134_MapReduce_Partition分区案例
135_MapReduce_Partition分区案例总结
136_每日回顾
137_MapReduce_回顾分区
138_MapReduce_排序概述
139_MapReduce_排序分类
140_MapReduce_全排序案例分析
141_MapReduce_全排序案例FlowBean
142_MapReduce_全排序案例Mapper
143_MapReduce_全排序案例Mapper_已处理
144_MapReduce_全排序案例实现及测试
145_MapReduce_分区排序案例实现及测试
146_MapReduce_Debug调试思想
147_MapReduce_Combiner理论
148_MapReduce_Combiner案例实现
149_MapReduce_分组排序案例分析
150_MapReduce_分组排序案例OrderBean
151_MapReduce_分组排序案例Mapper
152_MapReduce_分组排序案例Driver
153_MapReduce_分组排序案例排序类
154_MapReduce_分组排序案例调试
155_MapReduce_分组排序案例扩展
156_MapReduce_MapTask工作机制(面试重点)
157_MapReduce_ReduceTask工作机制(面试重点)
158_MapReduce_ReduceTask个数设置
159_MapReduce_Shuffle机制(面试重点)
160_MapReduce_工作流程源码分析
161_MapReduce_OutPutFormat接口实现类
162_MapReduce_自定义OutputFormat案例分析
163_MapReduce_自定义OutputFormat案例实现
164_MapReduce_ReduceJoin理论
165_MapReduce_ReduceJoin案例分析
166_MapReduce_ReduceJoin案例TableBean
167_MapReduce_ReduceJoin案例Mapper
168_MapReduce_ReduceJoin案例Reduce
169_MapReduce_ReduceJoin案例Driver
170_MapReduce_ReduceJoin案例Debug和总结
171_MapReduce_MapJoin案例分析
172_MapReduce_MapJoin案例缓存文件处理
173_MapReduce_MapJoin案例测试
174_MapReduce_计数器应用
175_MapReduce_数据清洗案例
176_MapReduce_开发总结
177_压缩_概述
178_压缩_MR支持的压缩编码
179_压缩_方式选择
180_压缩_位置选择
181_压缩_参数设置
182_压缩_压缩案例
183_压缩_解压缩案例
184_压缩_Map和Reduce启用压缩案例
185_YARN_基本架构
186_YARN_工作机制
187_YARN_作业提交全流程
188_YARN_资源调度器
189_YARN_任务推测执行
190_企业调优_MR跑的慢的原因
191_企业调优_MR优化方法
192_企业调优_HDFS小文件处理
193_扩展案例_多Job串联案例分析
194_扩展案例_多Job串联案例第一个Job
195_扩展案例_多Job串联案例完成
196_扩展案例_TopN案例
197_扩展案例_找共同粉丝(学生版1)
198_扩展案例_找共同粉丝(学生版2)
199_Hadoop总结_企业真实面试题讲解
200_Hadoop总结_开发重点