初識Spark2.0之Spark SQL

內存計算平臺spark在今年6月份的時候正式發佈了spark2.0,相比上一版本的spark1.6版本,在內存優化,數據組織,流計算等方面都作出了較大的改變,同時更加註重基於DataFrame數據組織的MLlib,更加註重機器學習整個過程的管道化。java 固然,做爲使用者,特別是須要運用到線上的系統,大部分廠家仍是會繼續選擇已經穩定的spark1.6版本,而且在spark2.0逐漸成熟以後纔會開
相關文章
相關標籤/搜索