解決Python中下載cifar-10數據集緩慢問題

解決Python中下載cifar-10數據集緩慢問題

  最近須要使用cifar-10數據集進行開發,可是使用Python在下載的時候發現速度很是慢。下面介紹一下個人解決方法。html

一、下載cifax-10數據集,若是使用Python進行下載的話速度比較慢,這裏建議你直接到官網進行下載官網: 直接點擊下載便可。示例:python

在這裏插入圖片描述

而後選擇合適的位置保存便可,示例:函數

在這裏插入圖片描述

二、對下載好的文件進行解壓。示例:測試

在這裏插入圖片描述

文件的目錄以下所示:3d

在這裏插入圖片描述

三、使用Python3讀取cifar-10中的數據。示例代碼:code

def load_file(filename):
    # filename表示須要讀取文件的路徑
    with open(filename,'rb') as fo:
        data = pickle.load(fo,encoding='latin1')   # bytes 官方的例程    latin1 讀取數據
    return data

提示:上面的方法須要本身編寫程序進行讀取。須要時刻注意文件的路徑htm

四、上面的方法須要本身編寫程序進行數據的讀取,編寫過程比較麻煩,並且容易出錯。下面介紹使用Keras庫中的cifar10.load_data()函數進行數據讀取,直接能夠讀取出訓練集和測試集。這裏須要你首先安裝tensorflow庫和Keras庫。blog

(1)將剛纔下載的壓縮文件直接複製,放到Keras庫的數據集文件夾下,通常狀況下在"C:\Users\用戶名.keras\datasets" 下,若是有特殊狀況讀者能夠自行尋找,而後將壓縮文件粘貼到datasets文件夾下便可。圖片

在這裏插入圖片描述

(2)修改文件名。將文件名由:cifar-10-python.tar.gz 改成:cifar-10-batches-py.tar.gz點擊保存便可。示例:ci

在這裏插入圖片描述

(3)修改好文件名以後,直接退出,使用Python代碼直接讀取數據。示例:

from keras.datasets import cifar10  # 讀取數據集
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

提示:當上面程序運行時,會自動將壓縮包進行解壓操做,無需本身手動進行解壓。

至此,當數據解壓完成以後,就可使用Keras庫內置的函數進行讀取數據了。

相關文章
相關標籤/搜索