Spark DataFrame 添加自增id

Spark DataFrame 添加自增id 在用SparkSQL 處理數據的時候,常常須要給全量數據增長一列自增ID序號,在存入數據庫的時候,自增ID也經常是一個很關鍵的要素。在DataFrame的API中沒有實現這一功能,因此只能經過其餘方式實現,或者轉成RDD再用RDD的 zipWithIndex 算子實現。下面呢就介紹兩種實現方式html 方式一:利用窗口函數 // 加載數據 val da
相關文章
相關標籤/搜索