最新路口

一、基本介紹 是什麼? 快速,通用,可擴展的分佈式計算引擎。 彈性分佈式數據集RDD RDD(Resilient Distributed Dataset)彈性分佈式數據集,是Spark中最基本的數據(邏輯)抽象,它代表一個不可變、可分區、裏面的元素可並行計算的集合。 RDD具有數據流模型的特點:自動容錯、位置感知性調度和可伸縮性。RDD允許用戶在執行多個查詢時顯式地將工作集緩存在內存中,後續的查詢
相關文章
相關標籤/搜索