課程描述INTRODUCTION
數(shù)據(jù)分析平臺(tái)
· 中層領(lǐng)導(dǎo)· 新晉主管· 總經(jīng)理· 營(yíng)銷(xiāo)總監(jiān)
![](/Common/new/images/tb3_1.jpg)
![](/Common/new/images/tb3_2.jpg)
![](/Common/new/images/tb3_3.jpg)
日程安排SCHEDULE
課程大綱Syllabus
數(shù)據(jù)分析平臺(tái)課程大綱:
數(shù)據(jù)分析平臺(tái)第一天
第1個(gè)主題:Hadoop的來(lái)源和動(dòng)機(jī)
1.傳統(tǒng)大規(guī)模系統(tǒng)存在的問(wèn)題
2.對(duì)一種新的解決方案的需求
3.Hadoop應(yīng)用案例解析
4.Hadoop 版本介紹
5.Hadoop與傳統(tǒng)分布式環(huán)境的區(qū)別
第2個(gè)主題:Hadoop安裝和部署準(zhǔn)備
1.Hadoop系統(tǒng)模塊組件概述
2.Hadoop試驗(yàn)集群的部署結(jié)構(gòu)
3.Hadoop 安裝依賴(lài)關(guān)系
4.Hadoop 生產(chǎn)環(huán)境的部署結(jié)構(gòu)
第3個(gè)主題:Hadoop集群安裝和部署
第4個(gè)主題:Hadoop組件詳解
1.Hadoop HDFS 基本結(jié)構(gòu)
2.Hadoop HDFS 副本存放策略
3.Hadoop NameNode 詳解
4.Hadoop SecondaryNameNode 詳解
5.Hadoop DataNode 詳解
6.Hadoop JobTracker 詳解
7.Mapper
8.Reducer
9.API 使用Eclipse進(jìn)行快速開(kāi)發(fā)
10.新MapReduce API
第5個(gè)主題:Hadoop 核心代碼剖析
1. Hadoop Mapper 類(lèi)核心代碼剖析
2. Hadoop Reducer 類(lèi)核心代碼剖析
第6個(gè)主題:HDFS分布式文件系統(tǒng)編程
1. Hadoop HDFS 剖析
2. Hadoop NameNode 剖析
3. Hadoop DataNode 剖析
4. hadoop I/O 操作
5. 使用Hadoop HDFS API對(duì)HDFS編程
第7個(gè)主題
數(shù)據(jù)分析平臺(tái)第二天
第1個(gè)主題:Hadoop MapReduce
1. Hadoop JobTracker 剖析
2.Hadoop TaskTracker 剖析
3.Hadoop 任務(wù)提交流程剖析
第2個(gè)主題: Hadoop MapReduce Streaming編程
1. Hadoop Streaming 和 Java MapReduce Api 差異
2. 使用 MapReduce 實(shí)現(xiàn)數(shù)據(jù)庫(kù)功能
第3個(gè)主題:MapReduce分布式程序
1. MapReduce流程
2.剖析一個(gè)MapReduce程序
3.基本MapReduceAPI 概念
4.驅(qū)動(dòng)代碼
第4個(gè)主題:Hadoop Mapreduce高級(jí)編程
1.ToolRunner介紹
2.使用MRUnit進(jìn)行測(cè)試
3.利用Combiners來(lái)減少中間數(shù)據(jù)
4.使用Configure和Close方法來(lái)進(jìn)行Map/Reduce設(shè)置和關(guān)閉
5.編寫(xiě)Partitioner來(lái)優(yōu)化負(fù)載平衡
6.直接訪(fǎng)問(wèn)Hadoop分布式文件系統(tǒng)(HDFS)
7.使用分布式緩存(Distributed Cache)
第5個(gè)主題:MapReduce的優(yōu)化
1. map優(yōu)化
2. reduce優(yōu)化
3. 小文件優(yōu)化
第6個(gè)主題:MapReduce的任務(wù)調(diào)度
1. Queue調(diào)度的使用
2. 公平調(diào)度的使用
3. 能力調(diào)度的使用
第7個(gè)主題Hadoop 生態(tài)系統(tǒng)介紹
分布式管理組件-Zookeeper
分布式數(shù)據(jù)倉(cāng)庫(kù)-Hive
分布式數(shù)據(jù)庫(kù)-Hbase
數(shù)據(jù)導(dǎo)入導(dǎo)出-Sqoop
工作流管理- Ozzie
Hadoop數(shù)據(jù)倉(cāng)庫(kù)-Hive
Hive基礎(chǔ)
Hive的作用和原理說(shuō)明
Hadoop倉(cāng)庫(kù)和傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的協(xié)作關(guān)系;Hive與傳統(tǒng)數(shù)據(jù)庫(kù)的對(duì)接使用
Hadoop/Hive倉(cāng)庫(kù)數(shù)據(jù)數(shù)據(jù)流
數(shù)據(jù)分析平臺(tái)第三天
Hadoop數(shù)據(jù)倉(cāng)庫(kù)-Hive
Hive Cli 的基本用法
HQL基本語(yǔ)法
自行編寫(xiě)數(shù)據(jù)庫(kù)與Hadoop相互ETL工具的思路
Hadoop 分布式數(shù)據(jù)倉(cāng)庫(kù)-Hbase
Hbase概念與架構(gòu)
hbase核心知識(shí)點(diǎn)
hbase安裝、部署
Hbase配置優(yōu)化綜述
表設(shè)計(jì)優(yōu)化相關(guān)參數(shù)
監(jiān)控工具使用方法及注意事項(xiàng)
常見(jiàn)異?,F(xiàn)象級(jí)處理方法
數(shù)據(jù)分析平臺(tái)總結(jié)
轉(zhuǎn)載:http://xvaqeci.cn/gkk_detail/5836.html
已開(kāi)課時(shí)間Have start time
大數(shù)據(jù)課程內(nèi)訓(xùn)
- 《精細(xì)運(yùn)營(yíng)——京東/天貓平 武建偉
- 《銀行--網(wǎng)絡(luò)消費(fèi)行為與網(wǎng) 武建偉
- 數(shù)據(jù)驅(qū)動(dòng)價(jià)值 ——基于Ex 張曉如
- 《小紅書(shū)運(yùn)營(yíng)零售專(zhuān)賣(mài)》 劉錦州
- 《大數(shù)據(jù)精益化營(yíng)銷(xiāo)思維與運(yùn) 喻國(guó)慶
- 數(shù)據(jù)創(chuàng)造價(jià)值——大數(shù)據(jù)分析 張曉如
- 《流量神器,銷(xiāo)量升級(jí):如何 武建偉
- 大數(shù)據(jù)項(xiàng)目解決方案及應(yīng)用 胡國(guó)慶
- 建材門(mén)店--微信獲客與運(yùn)營(yíng) 武建偉
- 互聯(lián)網(wǎng)大數(shù)據(jù)分析管理 孫平
- 大數(shù)據(jù)提升:用戶(hù)體驗(yàn)提升與 武建偉
- 《大數(shù)據(jù)分析與客戶(hù)開(kāi)發(fā)》 喻國(guó)慶