大數據面試題

1.列舉spark 比hadoop 快的原 因 ,以及如今存在的主要問題 2.描述下使用spark streaming 和 GraphX實現實時計算的可行性,以及可能會遇到的問題 3.GraphX的Pregel API 只支持有向圖遍歷  ,如何實現無xiang 遍歷,描述思路 4.SPark 經過yarn 提交任務時,yarn-client & yarn-cluster 的區別 5.Spark
相關文章
相關標籤/搜索