spark算子:distinct去重的原理

1、Distinct是transformation算子,不是action算子。 2、Distinct的去重,是當key與value都一樣的時候,會被當做重複的數據。      也就是說,有多條key和value都相同的數據在執行完distincct之後,只會保留1條。 原文地址:https://blog.csdn.net/wyqwilliam/article/details/82110860
相關文章
相關標籤/搜索