Spark RDD

轉自:https://blog.csdn.net/u011564172/article/details/53310530 概要         RDD是爲了處理迭代算法和數據發掘應運而生的,keep數據在內存,顯著提升性能。         RDD基於lineage實現容錯,而不是shared state的update。 簡介        背景        原有的並行框架MapReduce無法
相關文章
相關標籤/搜索