分分鐘帶你殺入Kaggle Top 1%

不知道你有沒有這樣的感覺,在剛剛入門機器學習的時候,咱們通常都是從MNIST、CIFAR-10這一類知名公開數據集開始快速上手,復現別人的結果,但總以爲過於簡單,給人的感受太不真實。由於這些數據太「完美」了(乾淨的輸入,均衡的類別,分佈基本一致的測試集,還有大量現成的參考模型),要成爲真正的數據科學家,光在這些數據集上跑模型倒是遠遠不夠的。而現實中你幾乎不可能遇到這樣的數據(現實數據每每有着殘缺的
相關文章
相關標籤/搜索