解決Python中下載cifar-10數據集緩慢問題

時間 2020-05-30

標籤解決 python 下載 cifar 數據緩慢問題欄目 Python 简体版

原文原文鏈接

解決Python中下載cifar-10數據集緩慢問題

最近須要使用cifar-10數據集進行開發，可是使用Python在下載的時候發現速度很是慢。下面介紹一下個人解決方法。html

一、下載cifax-10數據集，若是使用Python進行下載的話速度比較慢，這裏建議你直接到官網進行下載，官網：直接點擊下載便可。示例：python

而後選擇合適的位置保存便可，示例：函數

二、對下載好的文件進行解壓。示例：測試

文件的目錄以下所示：3d

三、使用Python3讀取cifar-10中的數據。示例代碼：code

def load_file(filename):
    # filename表示須要讀取文件的路徑
    with open(filename,'rb') as fo:
        data = pickle.load(fo,encoding='latin1')   # bytes 官方的例程    latin1 讀取數據
    return data

提示：上面的方法須要本身編寫程序進行讀取。須要時刻注意文件的路徑。htm

四、上面的方法須要本身編寫程序進行數據的讀取，編寫過程比較麻煩，並且容易出錯。下面介紹使用Keras庫中的cifar10.load_data()函數進行數據讀取，直接能夠讀取出訓練集和測試集。這裏須要你首先安裝tensorflow庫和Keras庫。blog

（1）將剛纔下載的壓縮文件直接複製，放到Keras庫的數據集文件夾下，通常狀況下在"C:\Users\用戶名.keras\datasets" 下，若是有特殊狀況讀者能夠自行尋找，而後將壓縮文件粘貼到datasets文件夾下便可。圖片

（2）修改文件名。將文件名由：cifar-10-python.tar.gz 改成：cifar-10-batches-py.tar.gz點擊保存便可。示例：ci

（3）修改好文件名以後，直接退出，使用Python代碼直接讀取數據。示例：

from keras.datasets import cifar10  # 讀取數據集
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

提示：當上面程序運行時，會自動將壓縮包進行解壓操做，無需本身手動進行解壓。

至此，當數據解壓完成以後，就可使用Keras庫內置的函數進行讀取數據了。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。