大數據學習之路80-RDD的存儲級別

前面我們說過如果我們想提高spark RDD的執行效率的話,我們可以將常用的RDD cache到內存中這樣我們用的話就可以直接拿,執行的效率也會快很多,當然這個cache如果不釋放就會一直佔用內存的空間。 兩次執行rdd2.count的速度明顯不一樣,第二次的速度會更快 第一次用了3秒,第二次僅用了0.2秒,這都是緩存的功勞 這就是我們的緩存,佔用了352B的空間,如果不釋放的話就會一直存在。 我
相關文章
相關標籤/搜索