什么是hadoop
一、Hadoop入門,了解什么是hadoop
1. Hadoop產生背景
2. Hadoop在大數據、云計算中的位置和關系
3. 國內外Hadoop應用案例介紹
4. 國內Hadoop的就業(yè)情況分析及課程大綱介紹
5. Hadoop生態(tài)圈以及各組成部分的簡介
6. Hadoop核心MapReduce簡單例子說明
二、分布式文件系統(tǒng)HDFS,是數據庫管理員的基礎課程
1. 分布式文件系統(tǒng)DFS簡介
2. HDFS的系統(tǒng)組成介紹
3. HDFS的組成部分詳解
4. 副本存放策略及路由規(guī)則
5. 命令行接口
6. Java接口
7. 客戶端與HDFS的數據流講解
8. HDFS的可用性(HA)
三、初級MapReduce,成為Hadoop開發(fā)人員的基礎課程
1. 如何理解map、reduce計算模型
2. 剖析偽分布式下MapReduce作業(yè)的執(zhí)行過程
3. 序列化
4. MapReduce的類型與格式
5. MapReduce開發(fā)環(huán)境搭建
6. MapReduce應用開發(fā)
7. 更多示例講解,熟悉MapReduce算法原理
四、高級MapReduce,高級Hadoop開發(fā)人員的關鍵課程
1. 使用壓縮分隔減少輸入規(guī)模
2. 利用Combiner減少中間數據
3. 編寫Partitioner優(yōu)化負載均衡
4. MapReduce優(yōu)化
5. 編程實戰(zhàn)
五、Hadoop集群與管理,是數據庫管理員的高級課程
1. Hadoop集群的搭建
2. Hadoop集群的監(jiān)控
3. Hadoop集群的管理
4. 集群下運行MapReduce程序
六、HBase基礎知識,面向列的實時分布式數據庫
1. HBase定義
2. HBase與RDBMS的對比
3. 數據模型
4. 系統(tǒng)架構
5. HBase上的MapReduce
6. 表的設計
七、HBase集群及其管理
1. 集群的搭建過程講解
2. 集群的監(jiān)控
3. 集群的管理
八、HBase客戶端
1. HBase Shell以及演示
2. Java客戶端以及代碼演示
九、Hive
1. 數據倉庫基礎知識
2. Hive定義
3. Hive體系結構簡介
4. Hive集群
5. 客戶端簡介
十、HiveQL
1. HiveQL定義
2. HiveQL與SQL的比較
3. 數據類型
4. 表與表分區(qū)概念
5. 表的操作與CLI客戶端演示
6. 數據導入與CLI客戶端演示
7. 查詢數據與CLI客戶端演示
8. 數據的連接與CLI客戶端演示
9. 用戶自定義函數(UDF)的開發(fā)與演