Spark DataFrame 的 groupBy vs groupByKey

在使用 Spark SQL 的過程當中,常常會用到 groupBy 這個函數進行一些統計工做。可是會發現除了 groupBy 外,還有一個 groupByKey(**注意RDD 也有一個 groupByKey,而這裏的 groupByKey 是 DataFrame 的 **) 。這個 groupByKey 引發了個人好奇,那咱們就到源碼裏面一探究竟吧。web 所用 spark 版本:spark 2
相關文章
相關標籤/搜索