對Spark中Broadcast的理解

用Broadcast廣播的變量是隻讀變量,可以有效的保持數據的一致性。 Broadcast的Storage Level是MEMORY_AND_DISK方式,所以不會造成內存溢出。 Broadcast廣播的變量只會在Executor中保存一份,同一個Executor中所有task共享該變量,可以有效的減少內存的開銷。
相關文章
相關標籤/搜索