課程描述INTRODUCTION
Hadoop大數(shù)據(jù)平臺課程培訓



日程安排SCHEDULE
課程大綱Syllabus
Hadoop大數(shù)據(jù)平臺課程培訓
【課程背景】
數(shù)字化浪潮是人類正在經(jīng)歷的第五次信息革命。數(shù)字化一方面使得信息的搜集、存儲、處理、分發(fā)具有了前所未有的效率;另一方面,使得信息從其附著物上分離出來,得以獨立于實物、空間和時間而存在。數(shù)字化是大數(shù)據(jù)的根本。大數(shù)據(jù)的本質(zhì)是對事物規(guī)律的深刻洞察。學習大數(shù)據(jù)需要掌握其特征描述,包括大數(shù)據(jù)的技術特征和大數(shù)據(jù)的價值邏輯。本次課程授課范圍為大數(shù)據(jù)的技術特征。本課程分為理論和實踐兩部分。理論部分主要帶學員了解大數(shù)據(jù)的基本概念和關鍵技術,介紹當前大數(shù)據(jù)平臺的基本架構,重點介紹Hadoop生態(tài)系統(tǒng)框架及其HDFS、YARN、MapReduce2.0、Hbase、Zookeeper等組件的原理及應用。帶學員了解Hadoop大數(shù)據(jù)平臺的運維,幫助學員建立完整的大數(shù)據(jù)認知體系。實踐課程為Hadoop實驗課程。帶領學員動手搭建Hadoop環(huán)境,完成Spark計算框架的搭建,完成XXX和XXX兩個操作實驗。
【課程特點】
授課形式:理論講解+動手實驗
時間安排:系統(tǒng)學習1天(6小時)
理論講解與動手實驗相結合。其中理論講解占50%,動手實驗占50%。
【課程收益】
1.了解大數(shù)據(jù)的基本概念、發(fā)展歷程、主流技術和應用場景等。通過分析大數(shù)據(jù)平臺在建設、生產(chǎn)和運維過程中出現(xiàn)的問題,幫助學員逐步形成解決問題的思路。
2.通過實驗課程掌握Hadoop生態(tài)系統(tǒng)基本組件的運用。學會使用MapReduce和Spark計算框架解決實際問題。
【受眾對象】
1.云計算和電信行業(yè)領域的技術人員、管理人員、政企客戶經(jīng)理、產(chǎn)品經(jīng)理、項目經(jīng)理
2.管理支持組織中數(shù)據(jù)中心運行、規(guī)劃、設計負責人
3.希望提升自身職業(yè)能力的人員、其他對大數(shù)據(jù)技術感興趣的人員
【課程內(nèi)容】
一.大數(shù)據(jù)基本概念及關鍵技術
1.大數(shù)據(jù)的基本概念
●信息革命與數(shù)字化浪潮
●大數(shù)據(jù)的產(chǎn)生背景定義和特征
●大數(shù)據(jù)與云計算的關系
●大數(shù)據(jù)的影響
●大數(shù)據(jù)在行業(yè)的價值體現(xiàn)
2.大數(shù)據(jù)的關鍵技術
●傳統(tǒng)架構的局限性
●大數(shù)據(jù)理論基礎
●大數(shù)據(jù)總體架構和關鍵技術
●大數(shù)據(jù)匯聚
●大數(shù)據(jù)處理
●大數(shù)據(jù)分析
●大數(shù)據(jù)展現(xiàn)
●大數(shù)據(jù)開放
二.大數(shù)據(jù)平臺架構
1.大數(shù)據(jù)平臺詳細架構
●大數(shù)據(jù)平臺功能邏輯架構
●Hadoop集群架構
●MPP集群架構
●流處理+內(nèi)存數(shù)據(jù)庫架構
●大數(shù)據(jù)平臺數(shù)據(jù)流程
●大數(shù)據(jù)平臺的管理
●大數(shù)據(jù)平臺能力開放
2.行業(yè)大數(shù)據(jù)平臺
●某運營商大數(shù)據(jù)平臺
●某銀行大數(shù)據(jù)平臺
●某互聯(lián)網(wǎng)公司大數(shù)據(jù)平臺
三.Hadoop生態(tài)系統(tǒng)
1.初識Hadoop
●Hadoop生態(tài)系統(tǒng)
●Hadoop歷史版本變遷介紹
●Hadoop基本組件
2.Hadoop三大組件的原理
●分布式文件系統(tǒng)原理
●HDFS原理
●HDFS讀寫過程
●MapReduce基本原理
●MapReduce框架
●Wordcount案例
●MapReduce內(nèi)部邏輯
●資源管理系統(tǒng)YARN
●YARN的作用
●YARN的基本原理
3.Hadoop生態(tài)系統(tǒng)
●Hadoop1.0~Hadoop3.0演進歷史
●Hive和Pig優(yōu)劣勢
●Mahout工具
●Hbase原理
●Hbase數(shù)據(jù)模型
●Hbase物理模型
●ZooKeeper
●Sqoop
●Flume
四.Hadoop平臺運維
1.Hadoop平臺運維
●自動擴縮容
●資源監(jiān)控
●資源分配管理
●權限管理
●平臺容災
2.Hadoop平臺運維案例
●Hadoop集群訪問安全控制
●Hadoop存儲共享計算隔離設計
●實時查詢庫Hbase多實例
●Flume集群高可用
●HDFS磁盤檢查機制優(yōu)化
五.動手實驗
1)Hadoop安裝
●Hadoop安裝-獲取linux操作系統(tǒng)
●Hadoop安裝-安裝JDK
●Hadoop安裝-配置hadoop
2)Hadoop的核心-HDFS簡介
●數(shù)據(jù)管理策略
●HDFS特點
●HDFS文件讀寫操作
3)Hadoop的核心-MapReduce原理與實現(xiàn)
●MapReduce的原理
●MapReduce的運行流程
●實驗一:WordCount單詞計數(shù)實例
●分片輸入—Map—Shuffle—Reduce過程總結
4)開發(fā)Hadoop應用程序
●相似度算法
●基于物品的推薦算法原理
●基于物品的推薦算法實戰(zhàn)
●實驗總結
補充章節(jié) 人工智能
1)未來已來
2)人工智能概念和應用
3)機器學習原理
4)云計算和大數(shù)據(jù)驅(qū)動深度學習
5)機器學習平臺架構
Hadoop大數(shù)據(jù)平臺課程培訓
轉(zhuǎn)載:http://www.xvaqeci.cn/gkk_detail/36883.html
已開課時間Have start time
- 唐杰
大數(shù)據(jù)課程公開培訓班
- 大數(shù)據(jù)分析(Hadoop) 朱永春
- 大數(shù)據(jù)時代的商業(yè)數(shù)據(jù)分析管 鄒紅偉
- 大數(shù)據(jù)分析與洞察 孫子辰
- 產(chǎn)品數(shù)據(jù)管理高級實務培訓 劉海濤
- 大數(shù)據(jù)時代的績效管理-精細 楊云
- 大數(shù)據(jù)時代財務管理-從業(yè)務 楊云
- 大數(shù)據(jù)、云計算與信息化演進 何寶宏
- 大數(shù)據(jù)時代的財務管理—從業(yè) 楊云
- 大數(shù)據(jù)時代企業(yè)公司化運營 楊云
- 贏在未來-大數(shù)據(jù)時代的財務 呂軍
- 大數(shù)據(jù)時代營銷數(shù)據(jù)分析技能 陳劍
- 大數(shù)據(jù)時代的績效管理 楊云
大數(shù)據(jù)課程內(nèi)訓
- 數(shù)字時代下的營銷趨勢 韓天成
- 數(shù)智化領域新技術與典型應用 胡國慶
- 數(shù)字經(jīng)濟時代銀行開展數(shù)字化 李勇
- Quick BI 數(shù)據(jù)分析 張曉如
- 《跨境電商全鏈路AI賦能轉(zhuǎn) 黃光偉
- 數(shù)字經(jīng)濟與數(shù)據(jù)技術應用與變 王文琭
- 數(shù)字技術與數(shù)字工具應用 王文琭
- 以需求為導向的大數(shù)據(jù)精準營 張世民
- 《銀行數(shù)據(jù)驅(qū)動經(jīng)營方法論與 宗錦(
- 大數(shù)據(jù)應用現(xiàn)狀與未來發(fā)展重 胡國慶
- 政府數(shù)字化轉(zhuǎn)型實務 焦波
- 《數(shù)據(jù)資源入表與數(shù)據(jù)治理》 鐘凱