Hadoop學習筆記

Hadoop Hadoop是一個實現了MapReduce和GFS技術的開源平臺。 Hadoop 1.x項目包含了許多子項目,最主要的兩個子項目是HDFS和MapReduce,HDFS(Hadoop分佈式文件系統)是一個可以存儲極大數據集的文件系統,建立在通過向外拓展方式構建的主機集羣上。 MapReduce是一個數據處理範式,應用於任意規模的大數據集。MapReduce任務直接在存儲所需數據的HD
相關文章
相關標籤/搜索