使用Sparksql求數據庫表中單列字段中出現次數最高的值,以及出現的次數

該方法是基於Sparksql的內置函數進行計算 我先上代碼: dataset和columnName作爲參數,dataset是什麼就不說了,columnName就是我要執行的字段名 首先通過dataset.groupBy(columnName)對該字段進行分組,再count(dataset.col(columnName))進行聚合,count中的參數必須是Column類型的,然後通過alias()取
相關文章
相關標籤/搜索