大數據基礎知識集合(三)

一、Hadoop 1、MapReduce——Hadoop的核心 MapReduce是一個可以對大量數據進行分佈式處理的軟件框架,MapReduce的重要創新是當處理一個大數據集查詢時會將其任務分解並在運行的多個節點中處理。 當數據量很大時就無法在一臺服務器上解決問題,此時分佈式計算優勢就體現出來。將這種技術與Linux服務器結合可獲得性價比極高的替代大規模計算陣列的方法。 2、HDFS 對於分佈式
相關文章
相關標籤/搜索