好程序員大數據教程分享之Hadoop優缺點

好程序員大數據教程分享之Hadoop優缺點,大數據成爲時代主流,開啓時代的大門,全球43億部電話、20億位互聯網用戶每秒都在不斷地產生大量數據,人們發送短信給朋友、上傳視頻、用手機拍照、更新社交網站的信息、轉發微博、點擊廣告等,使得機器產生和保留了愈來愈多的數據。咱們被數據所包圍,咱們源源不斷地製造新的數據。數據指數級地增加,對於各大互聯網公司提出了新得挑戰!程序員

咱們須要對TB級別和PB級別的數據進行分析處理,以發現哪些網站更受歡迎,哪些商品更具備吸引力,哪些廣告更吸引用戶。傳統的工具對於處理如此規模的數據集愈來愈無能爲力。而Hadoop的出現將彌補這一技術空白。框架

咱們說Hadoop應運而生,有了它,龐大的信息流有了新的處理平臺。它被咱們譽爲神奇的存在,幫助咱們在挑戰中製造新的機遇!簡要分享Hadoop優缺點,方便你們學習和分享!分佈式

一、Hadoop的優勢工具

  (1)Hadoop具備按位存儲和處理數據能力的高可靠性。oop

  (2)Hadoop經過可用的計算機集羣分配數據,完成存儲和計算任務,這些集羣能夠方便地擴展到數以千計的節點中,具備高擴展性。學習

  (3)Hadoop可以在節點之間進行動態地移動數據,並保證各個節點的動態平衡,處理速度很是快,具備高效性。大數據

  (4)Hadoop可以自動保存數據的多個副本,而且可以自動將失敗的任務從新分配,具備高容錯性。網站

  二、Hadoop的缺點spa

  (1)Hadoop不適用於低延遲數據訪問。視頻

  (2)Hadoop不能高效存儲大量小文件。

  (3)Hadoop不支持多用戶寫入並任意修改文件。

  Hadoop的核心組件

  三、Hadoop版本簡介:

  Hadoop自誕生以來,主要出現了Hadoop一、Hadoop二、Hadoop3三個系列多個版本。

  HDFS和MapReduce是Hadoop1的核心組件,Hadoop生態圈裏的不少組件都是基於HDFS和MapReduce發展出來的。在繼Hadoop1以後出現了Hadoop2,Hadoop2在Hadoop1的基礎上作了改進。相比Hadoop1,Hadoop2的三大核心組件分別是HDFS、MapReduce、Yarn。目前市面上絕大部分企業使用的是Hadoop2。

  Hadoop2的一個公共模塊和三大核心組件組成了四個模塊,簡介以下:

  (1)Hadoop Common:爲其餘Hadoop模塊提供基礎設施。

  (2)HDFS:具備高可靠性、高吞吐量的分佈式文件系統。

  (3)MapReduce:基於Yarn系統,分佈式離線並行計算框架。

(4)Yarn:負責做業調度與集羣資源管理的框架。

相關文章
相關標籤/搜索