2020華爲雲大數據挑戰賽(knn+QuickBundles+LGB、 利用folium可視化、海運ETA預測)

比賽結束,由於復現出現了一些失誤(現在想來完全可以避免,也算是踩坑了=。=)沒能去決賽,這裏還是進行一些簡單總結。 數據特點以及難點: 測試集數據採樣點紊亂,跟訓練集不同,導致很多模型達不到理想效果。 訓練集給的路由比較髒,測試集也幾乎只有起始和終點的路由,中間路由都不乾淨。 預處理部分: (1)將'loadingOrder','carrierName',"longitude","latitude
相關文章
相關標籤/搜索