hadoop不一樣版本有哪些

1、Hadoop是什麼?多線程

首次聽到hadoop此次單詞,相信不少人跟我當時是同樣,難免心中畫上一個大大的問號——這是什麼東西?Hadoop是什麼?百度百科的解釋是:Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。換句話說就是hadoop是一個可以對大量數據進行分佈式處理的軟件框架。架構

Hadoopd之所謂會誕生,主要是因爲進入到大數據時代,計算機須要處理的數據量太過龐大。這時就須要將這些龐大數據切割分配到N臺計算機進行處理。當大量信息被分配到不一樣計算機進行處理時,要確保最終獲得的結果正確就須要對這些分佈處理的信息進行管理,hadoop就是這樣的一套解決方案。框架

經過一個簡單通俗的例子說明:假如說你有一個籃子水果,你想知道蘋果和梨的數量是多少,那麼只要一個一個數就能夠知道有多少了。若是你有一個集裝箱水果,這時候就須要不少人同時幫你數了,這至關於多進程或多線程。若是你不少個集裝箱的水果,這時就須要分佈式計算了,也就是Hadoop。分佈式

2、hadoop的版本工具

隨着這幾年大數據浪潮的興起,hadoop的各類版本也快速在國內流傳和使用。當前主要的hadoop版本有如下幾種:oop

一、Apache hadoop 的2.0版本,它的模塊主要有如下幾個:性能

(1)hadoop通用模塊,支持其餘hadoop模塊的通用工具集;大數據

(2)Hadoop分佈式文件系統,支持對應數據高吞吐量訪問的分佈式文件系統;優化

(3)用於做業調度和集羣資源管理的Hadoop YANRN框架;操作系統

(4)Hadoop MapReduce,基於YARN的大數據並行處理系統。

二、Cloudera hadoop:Cloudera版本層次更加清晰,且它提供了適用於各類操做系統的Hadoop安裝包,可直接使用apt-get或者yum命令進行安裝,更加省事。

三、Hortonworks:Hortonworks 的主打產品是Hortonworks Data Platform (HDP),也一樣是100%開源的產品,HDP除了常見的項目外還包含了Ambari,一款開源的安裝和管理系統。HCatalog,一個元數據管理系統,HCatalog現已集成到Facebook 開源的Hive中。Hortonworks的Stinger開創性地極大地優化了Hive項目。Hortonworks爲入門提供了一個很是好的,易於使用的沙盒。Hortonworks開發了不少加強特性並提交至核心主幹,這使得Apache Hadoop可以在包括Windows Server和Windows Azure在內的Microsoft Windows平臺上本地運行。

3、國產hadoop發行版有哪些

國內作hadoop發行版的像華爲大快搜索都有推出本身的發行版。華爲在硬件上有自然的有事,華爲的FusionInsight Hadoop版本基於Apache Hadoop,構建NameNode、JobTracker、HiveServer的HA功能,進程故障後系統自動Failover,無需人工干預,這個也是對Hadoop的小修補,遠不如MapR解決的完全。

大快搜索推出的DKhaoop, 是目前已知的國產發行版中惟一一個純原生態的開發,集成了整個HADOOP生態系統的所有組件,並深度優化,從新編譯爲一個完整的更高性能的大數據通用計算平臺,實現了各部件的有機協調。所以DKH相比開源的大數據平臺,在計算性能上有了高達5倍(最大)的性能提高。

相關文章
相關標籤/搜索