spark爲什麼這麼快

作者:張科   網上答案都是千篇一律:數據都在內存所以快,是有誤區的。 聊spark必須聊rdd, rdd 全英文 Resilient Distributed Datasets,搞懂這三個單詞就完事了其實。 Resilient:能復原的,彈回的,有彈性的。談談spark的內存機制,spark的內存整體分外堆內內存和對外內存,而在內存的使用上又分爲數據內存和運行內存,就是數據存儲和程序運行。 堆內內
相關文章
相關標籤/搜索