SPARK SQL華爲應用現狀分析

SPARK是一個分佈式的基於內存的大數據執行引擎,最先由加州伯克利大學AMP Lab主導開發,後來加入apache社區孵化,進而成爲apache頂級大數據項目。目前spark在開源社區和工業界很是火爆,堪稱大數據最活躍的開源項目。Spark在大數據領域之因此受到如此青睞,主要源於以下幾方面優點:html 數據集抽象: 提供一個分佈式彈式數據集(RDD,ResilientDistributed Da
相關文章
相關標籤/搜索