Hadoop中的發展歷史

Hadoop使用分佈式文件HDFS系統,用於存儲大數據(數據至少要到TB吧)。版本1的時候,使用MapReduce來作計算處理。版本2的時候,使用yarn來作計算處理。可是這兩個版本都是使用磁盤空間做爲計算。版本3的時候,Hadoop支持Spark來計算處理。Spark即支持磁盤作數據處理,也支持內存來作數據處理。Spark支持Python,JAVA,Scala語言。框架 MapReduce、ya
相關文章
相關標籤/搜索