Spark SQL解析過程

黃色的是數據結構,藍色的spark的模塊,綠色的是hive matestore 。 SQL和DataFrame 進來會先解析成邏輯執行計劃,從hive metasotre裏面拿一些表、字段的元數據信息,生成一個解析過的執行計劃。經過spark的優化器,改變邏輯執行計劃的邏輯結構,通過planner生成物理的執行計劃。 將sql轉換成抽象語法書(邏輯執行計劃) 右邊的含義:relation就是一個表
相關文章
相關標籤/搜索