Spark學習1 初識Hadoop

Hadoop是什麼 Hadoop是一個開發和運行處理大規模數據的軟件平臺,是Appach的一個用java語言實現的開源軟件框架,在大量計算機組成的集羣中對海量數據實現分佈式計算。 Hadoop生態圈 Hadoop框架的最核心設計:HDFS和MapReduce。 HDFS—Hadoop分佈式文件系統,提供海量數據的存儲。是一種數據分佈式保存機制,數據被保存在計算機集羣上。 HDFS的關鍵元素: 1)
相關文章
相關標籤/搜索