機器學習訓練集測試集劃分-按比例抽取,交叉檢驗?

1.打亂數據 shuffle 我們有下面以個DataFrame 我們可以看到BuyInter的數值是按照0,-1,-1,2,2,2,3,3,3,3這樣排列的,我們希望不保持這個次序,但是同時列屬性又不能改變。 方法1:sample  df.sample(frac=1) 這樣對可以對df進行shuffle。其中參數frac是要返回的比例,比如df中有10行數據,我只想返回其中的30%,那麼frac=
相關文章
相關標籤/搜索