關於機器學習所須要的測試數據集合

關於機器學習所須要的測試數據集合

 

Kaggle網址(用的最多):https://www.kaggle.com/datasetshtml

 

UCI數據集網址(其次): http://archive.ics.uci.edu/ml/git

 

scikit-learn網址(最少):http://scikit-learn.org/stable/datasets/index.html#datasetsgithub

 

訓練數據數據庫

一、計算機視覺機器學習

(1)人臉數據:學習

A、香港中文大學訓練數據集:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html  測試

此數據庫包含了20w張人臉圖片,每張圖片標註了5個特徵點、以及幾十種屬性(是否微笑、膚色、髮色、性別等屬性)網站

B、68我的臉特徵點:http://ibug.doc.ic.ac.uk/resources/facial-point-annotations/code

此網站差很少能夠下載到3000張,訓練數據圖片,每張圖片標註了68我的臉特徵點htm

C、74我的臉特徵點:http://gaps-zju.org/DDE/ 

這個網站包好了1.4w張的人臉訓練數據圖片,每張圖片標註了74我的臉特徵點。不過這個數據感受標註的很不精確

D、性別與年齡訓練數據:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

這個網站包含了500k+的人臉性別與年齡訓練數據,同時還有文獻及代碼,對於搞性別年齡預測,資源充足

 

(2)深度估計、圖像分割:

A、RGBD訓練數據列表:http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/

 

 

二、天然語言

(1)問答系統:https://github.com/karthikncode/nlp-datasets

相關文章
相關標籤/搜索