Spark中dataframe裏data.drop()和data.na.drop()的區別

問題描述:原始數據data總行數是1303638,使用data.drop()後數據總行數是1303638,使用data.na.drop()後數據總行數是0;爲啥data.drop()沒有丟棄null或nan的數據? 總結:     1)data.drop()如果不傳遞列名,不會做任何操作;     2)通過以下比較發現,drop是用來丟棄列的,而na.drop是用來丟棄行的;     3)通過以下
相關文章
相關標籤/搜索