Spark調優（數據序列化和內存調優）

時間 2019-12-05

標籤 spark 數據序列內存欄目 Spark 简体版

原文原文鏈接

翻譯自Spark官網文檔：https://spark.apache.org/docs/2.1.0/tuning.htmlhtml 前言因爲大多數Spark計算的內存使用特性，集羣中的任何資源均可能成爲Spark計算程序中的瓶頸：CPU，網絡帶寬或是內存。大多數狀況下，若是內存能夠容納數據量，那麼瓶頸就會是網絡帶寬，但有時，用戶也須要去作一點調優的工做，例如以序列化的格式存儲RDD，來減小

>>阅读原文<<