將一組很大的數據集隨機分成兩組數據

最近在看機器學習的東西時發現了一些特別好玩的東西,機器學習中又分爲訓練集和測試集,如何把一組很大的數據分爲這兩個集合呢?可以使用接下來的函數完成: 當然由於random這個隨機數生成函數每次產生的數不一定都是剛好達到你的期望,所以總會有一點小小的誤差。例如閾值爲0.5兩個數組的數量卻不是一樣的: 但對於一個很大的數據集來說,這點誤差可以忽略。
相關文章
相關標籤/搜索