數據集從哪裏來?

在入門NLP以前,博主也是一頭霧水,數據集不知道從哪裏來,模型無法訓練,故而對於模型及算法的細節得不到實現,更看不到模型運行後的效果,因此博主簡單總結如下幾點,當缺乏數據集時該怎麼辦?算法

1.若是你的方向是CV,那麼通常是對現有的數據作數據加強,圖片作各類旋轉、斜切、曝光等;不過最好的方式仍是經過使用膠囊網絡來進行學習,經過學習到各類角度問題來解決數據不足的問題;網絡

2.若是你的方向是NLP,經過爬蟲去收集一些商品或店鋪的評價及分數,經常使用的爬蟲有bs4,scrapy等經常使用框架,若有學習的須要,私聊我(超詳細的資料哦);框架

3.互聯網知名比賽所用數據集或其餘公開的數據集,好比天池等,博主已經收集CV、NLP等一些經常使用的任務的數據集,若有須要,私聊我哦);scrapy

相關文章
相關標籤/搜索