Kaggle網址(用的最多):https://www.kaggle.com/datasetshtml
UCI數據集網址(其次): http://archive.ics.uci.edu/ml/git
scikit-learn網址(最少):http://scikit-learn.org/stable/datasets/index.html#datasetsgithub
訓練數據數據庫
一、計算機視覺機器學習
(1)人臉數據:學習
A、香港中文大學訓練數據集:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html 測試
此數據庫包含了20w張人臉圖片,每張圖片標註了5個特徵點、以及幾十種屬性(是否微笑、膚色、髮色、性別等屬性)網站
B、68我的臉特徵點:http://ibug.doc.ic.ac.uk/resources/facial-point-annotations/code
此網站差很少能夠下載到3000張,訓練數據圖片,每張圖片標註了68我的臉特徵點htm
C、74我的臉特徵點:http://gaps-zju.org/DDE/
這個網站包好了1.4w張的人臉訓練數據圖片,每張圖片標註了74我的臉特徵點。不過這個數據感受標註的很不精確
D、性別與年齡訓練數據:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
這個網站包含了500k+的人臉性別與年齡訓練數據,同時還有文獻及代碼,對於搞性別年齡預測,資源充足
(2)深度估計、圖像分割:
A、RGBD訓練數據列表:http://www0.cs.ucl.ac.uk/staff/M.Firman/RGBDdatasets/
二、天然語言