餘老師帶你學習大數據-Spark快速大數據處理第四章第一節​Tez總體介紹

爲什麼選擇Tez 爲什麼要用Tez 在分佈式系統中要存儲海量的數據,因爲構建了一個非商務的機器上能夠運行的hdfs分佈式存儲空間,而且這個存儲空間是低成本的並且具有良好的擴展性。那麼,很多企業都會將海量的存儲數據遷移到Hadoop上,而摒棄之前用的ioe方式。然後,在利用Hive和Pig提供的類SQL語句完成我們的大規模的數據處理,以應對數據挖掘以及數據準備的應用場景。爲什麼這麼選擇,是因爲存儲廉
相關文章
相關標籤/搜索