一、Apache Hadoop 不足之處html
• 版本管理混亂
• 部署過程繁瑣、升級過程複雜
• 兼容性差
• 安全性低安全
二、Hadoop 發行版服務器
• Apache Hadoop
• Cloudera’s Distribution Including Apache Hadoop(CDH)
• Hortonworks Data Platform (HDP)
• MapR
• EMR
• …分佈式
三、CDH能解決哪些問題oop
• 1000臺服務器的集羣,最少要花費多長時間來搭建好Hadoop集羣,包括Hive、Hbase、Flume、Kafka、Spark等等
• 只給你一天時間,完成以上工做?
• 對於以上集羣進行hadoop版本升級,你會選擇什麼升級方案,最少要花費多長時間?
• 新版本的Hadoop,與Hive、Hbase、Flume、Kafka、Spark等等兼容?orm
四、CDH簡介 htm
• Cloudera's Distribution, including Apache Hadoop
• 是Hadoop衆多分支中的一種,由Cloudera維護,基於穩定版本的Apache Hadoop構建
• 提供了Hadoop的核心
– 可擴展存儲
– 分佈式計算
• 基於Web的用戶界面blog
五、CDH的優勢 hadoop
• 版本劃分清晰
• 版本更新速度快
• 支持Kerberos安全認證
• 文檔清晰
• 支持多種安裝方式(Cloudera Manager方式)文檔
六、CDH安裝方式
• Cloudera Manager
• Yum
• Rpm
• Tarball
七、CDH下載地址
• CDH5.4 http://archive.cloudera.com/cdh5/ •Cloudera Manager5.4.3: http://www.cloudera.com/downloads/manager/5-4-3.html