Spark SQL在100TB上的自適應執行實踐

做者:汪愈舟   俞育才   郭晨釗   程浩(英特爾),李元健(百度)sql 責編:錢曙光(qianshg@csdn.net)數據庫 Spark SQL是Apache Spark最普遍使用的一個組件,它提供了很是友好的接口來分佈式處理結構化數據,在不少應用領域都有成功的生產實踐,可是在超大規模集羣和數據集上,Spark SQL仍然遇到很多易用性和可擴展性的挑戰。爲了應對這些挑戰,英特爾大數據技術
相關文章
相關標籤/搜索