大數據處理框架Hadoop、Spark介紹

  一、Hadoop簡介     Hadoop是由java語言編寫的,在分佈式服務器集羣上存儲海量數據並運行分佈式分析應用的開源框架,其核心部件是HDFS與MapReduce。    HDFS是一個分佈式文件系統:引入存放文件元數據信息的服務器Namenode和實際存放數據的服務器Datanode,對數據進行分佈式儲存和讀取。     MapReduce是一個計算框架:MapReduce的核心思想
相關文章
相關標籤/搜索