整理對Spark SQL的理解

http://blog.csdn.net/pelick/article/details/22723699 Catalyst是與Spark解耦的一個獨立庫,是一個impl-free的執行計劃的生成和優化框架。 目前與Spark Core還是耦合的,對此user郵件組裏有人對此提出疑問,見mail。   以下是Catalyst較早時候的架構圖,展示的是代碼結構和處理流程。 Catalyst定位 其他系
相關文章
相關標籤/搜索