[Spark SQL03]Spark SQL願景

寫更少的代碼 加載更少的數據 將優化交給底層 1、寫更少的代碼 A.從wordcount角度看: MapReduce(代碼量最多)--->hive(代碼量少)---->Spark core(代碼量更少,但可讀性差)----->Spark SQL(代碼量少,可讀性好,性能更好) B.從外部數據源角度看: 爲文件輸入輸出提供了訪問的接口 C.從schema推導的角度來看: 可以自動推導數據類型,對於數
相關文章
相關標籤/搜索