Spark調優(數據序列化和內存調優)

翻譯自Spark官網文檔:https://spark.apache.org/docs/2.1.0/tuning.htmlhtml 前言     因爲大多數Spark計算的內存使用特性,集羣中的任何資源均可能成爲Spark計算程序中的瓶頸:CPU,網絡帶寬或是內存。大多數狀況下,若是內存能夠容納數據量,那麼瓶頸就會是網絡帶寬,但有時,用戶也須要去作一點調優的工做,例如以序列化的格式存儲RDD,來減小
相關文章
相關標籤/搜索