剛開始學習Hadoop時就曾經一直抱怨Hadoop的安裝部署爲何這麼麻煩,對於一個新手須要捯飭一天才能把分佈式環境安裝配置好。而對於一個自學Hadoop而周圍又沒人交流的菜鳥來講,我對Hadoop的理解一直停留在很膚淺的層面,能應用,但對內部的原理知之甚少。最近和一個作這方面的朋友聊天,他問我你學習Hadoop是用的什麼版本搭建環境,我說Hadoop版本那麼多我也記不太清了,他只是笑笑就沒再多問。apache
回來後我又仔細想了想他問的話,不會是問的別的意思吧,難道Hadoop不是隻分1.0.x和2.x這些雜七雜八的版本?上網一搜才感受這下丟人丟大發了,原來Hadoop除了Apache這個版本,還有這麼多第三方的版本,並且已經很好地解決了Hadoop部署管理複雜的問題。因此在此記錄一下,也給新人提個醒。安全
目前Hadoop的發行版除了Apache的開源版本以外,還有華爲發行版、Intel發行版、Cloudera發行版(CDH)、Hortonworks發行版(HDP)、MapR等,全部這些發行版均是基於Apache Hadoop衍生出來的,由於Apache Hadoop的開源協議容許任何人對其進行修改並做爲開源或者商業產品發佈。運維
國內大多數公司發行版是收費的,好比Intel發行版、華爲發行版等。不收費的Hadoop版本主要有國外的四個,分別是Apache基金會hadoop、Cloudera版本(CDH)、Hortonworks版本(HDP)、MapR版本。分佈式
優勢:工具
缺點:oop
優勢:學習
缺點:測試
綜上所述,考慮到大數據平臺高效的部署和安裝,中心化的配置管理,使用過程當中的穩定性、兼容性、擴展性,以及將來較爲簡單、高效的運維,遇到問題低廉的解決成本。
建議使用第三方發行版本。
其中在第三發發行版中,國內應用較多的是Cloudera的CDH。你們也能夠詳細對比優缺點,根據本身的須要作選擇。大數據