Spark入門學習——要點1

爲什麼80%的碼農都做不了架構師?>>>    1、collect() 函數     RDD 還有一個collect() 函數,可以用來獲取整個RDD 中的數據。如果你的程序把RDD 篩選到一個很小的規模,並且你想在本地處理這些數據時,就可以使用它。記住,只有當你的整個數據集能在單臺機器的內存中放得下時,才能使用collect(),因此,collect() 不能用在大規模數據集上。使用collec
相關文章
相關標籤/搜索