Spark面試

Spark面試 1. spark消費kafka,如何保證消息有序? 2.對於spark中的數據傾斜問題,你有什麼好的方案? 3.你所理解的spark的shuffle過程? 4.spark有哪些聚合類的算子,咱們應該儘可能避免什麼類型的算子? 5.spark-on-yarn做業執行流程,yarn-client和yarn-cluster有什麼區別? 6.spark爲何快,sparkSql必定比Hive
相關文章
相關標籤/搜索