最近須要使用cifar-10數據集進行開發,可是使用Python在下載的時候發現速度很是慢。下面介紹一下個人解決方法。html
一、下載cifax-10數據集,若是使用Python進行下載的話速度比較慢,這裏建議你直接到官網進行下載,官網: 直接點擊下載便可。示例:python
而後選擇合適的位置保存便可,示例:函數
二、對下載好的文件進行解壓。示例:測試
文件的目錄以下所示:3d
三、使用Python3讀取cifar-10中的數據。示例代碼:code
def load_file(filename): # filename表示須要讀取文件的路徑 with open(filename,'rb') as fo: data = pickle.load(fo,encoding='latin1') # bytes 官方的例程 latin1 讀取數據 return data
提示:上面的方法須要本身編寫程序進行讀取。須要時刻注意文件的路徑。htm
四、上面的方法須要本身編寫程序進行數據的讀取,編寫過程比較麻煩,並且容易出錯。下面介紹使用Keras庫中的cifar10.load_data()函數進行數據讀取,直接能夠讀取出訓練集和測試集。這裏須要你首先安裝tensorflow庫和Keras庫。blog
(1)將剛纔下載的壓縮文件直接複製,放到Keras庫的數據集文件夾下,通常狀況下在"C:\Users\用戶名.keras\datasets" 下,若是有特殊狀況讀者能夠自行尋找,而後將壓縮文件粘貼到datasets文件夾下便可。圖片
(2)修改文件名。將文件名由:cifar-10-python.tar.gz 改成:cifar-10-batches-py.tar.gz點擊保存便可。示例:ci
(3)修改好文件名以後,直接退出,使用Python代碼直接讀取數據。示例:
from keras.datasets import cifar10 # 讀取數據集 (x_train, y_train), (x_test, y_test) = cifar10.load_data()
提示:當上面程序運行時,會自動將壓縮包進行解壓操做,無需本身手動進行解壓。
至此,當數據解壓完成以後,就可使用Keras庫內置的函數進行讀取數據了。