Spark(29) -- SparkSQL底層如何執行

1. RDD 和 SparkSQL 運行時的區別 RDD 的運行流程 大致運行步驟 先將 RDD 解析爲由 Stage 組成的 DAG, 後將 Stage 轉爲 Task 直接運行 問題 任務會按照代碼所示運行, 依賴開發者的優化, 開發者的會在很大程度上影響運行效率 解決辦法 創建一個組件, 幫助開發者修改和優化代碼, 但這在 RDD 上是無法實現的 爲什麼 RDD 無法自我優化? RDD 沒有
相關文章
相關標籤/搜索