那些年我們玩過的Spark下的Standalone集羣模型

內存模型 RDD(彈性分佈式數據集) RDD的五大特性 a list of partiotioner。一組分區。partiotioner是一個抽象概念,指的是一片連續的空間,顧名思義一個RDD包含一組連續的空間。 a function for partiotioner 每一個partiotioner都有着一個函數對其進行運算。這也是spark並行計算的基礎。 a list of dependenc
相關文章
相關標籤/搜索