目錄html
將 numpy 數組存入文件,有多種文件類型可供選擇,對應地就有不一樣的方法來讀寫。python
下面我將介紹讀寫 numpy 的三類文件:數組
import numpy as np a = np.array(range(20)).reshape((4, 5)) print(a) # 後綴改成 .txt 同樣 filename = 'data/a.csv' # 寫文件 np.savetxt(filename, a, fmt='%d', delimiter=',') # 讀文件 b = np.loadtxt(filename, dtype=np.int32, delimiter=',') print(b)
缺點:性能優化
a
有多維時,須要將其 a.reshape((a.shape[0], -1))
後才能用這種方式保存。np.savetxt()
都會覆蓋以前的內容。import numpy as np a = np.array(range(20)).reshape((2, 2, 5)) print(a) filename = 'data/a.npy' # 寫文件 np.save(filename, a) # 讀文件 b = np.load(filename) print(b) print(b.shape)
優勢:性能
缺點:優化
import numpy as np a = np.array(range(20)).reshape((2, 2, 5)) b = np.array(range(20, 44)).reshape(2, 3 ,4) print('a:\n', a) print('b:\n', b) filename = 'data/a.npz' # 寫文件, 若是不指定key,那麼默認key爲'arr_0'、'arr_1',一直排下去。 np.savez(filename, a, b=b) # 讀文件 c = np.load(filename) print('keys of NpzFile c:\n', c.keys()) print("c['arr_0']:\n", c['arr_0']) print("c['b']:\n", c['b'])
優勢:code
缺點:htm
np.savez(filename, a, b=b)
。每次保存會覆蓋掉以前文件中存在的內容(若是有的話)。優勢:blog
import numpy as np import h5py a = np.array(range(20)).reshape((2, 2, 5)) b = np.array(range(20)).reshape((1, 4, 5)) print(a) print(b) filename = 'data/data.h5' # 寫文件 h5f = h5py.File(filename, 'w') h5f.create_dataset('a', data=a) h5f.create_dataset('b', data=b) h5f.close() # 讀文件 h5f = h5py.File(filename, 'r') print(type(h5f)) # 經過切片獲得numpy數組 print(h5f['a'][:]) print(h5f['b'][:]) h5f.close()
import numpy as np import h5py a = np.array(range(20)).reshape((2, 2, 5)) print(a) filename = 'data/a.h5' # 寫文件 h5f = h5py.File(filename, 'w') # 當數組a太大,須要切片進行操做時,能夠不直接對h5f['a']進行初始化; # 當以後不須要改變h5f['a']的shape時,能夠省略maxshape參數 h5f.create_dataset('a', shape=(2, 2, 5), maxshape=(None, 2, 5), dtype=np.int32, compression='gzip') for i in range(2): # 採用切片的形式賦值 h5f['a'][i] = a[i] h5f.close() # 讀文件 h5f = h5py.File(filename, 'r') print(type(h5f)) print(h5f['a']) # 經過切片獲得numpy數組 print(h5f['a'][:])
同一個 hdf5 文件能夠建立多個 dataset,讀取的時候按照 key 來便可。索引
當Python趕上HDF5--性能優化實戰 -- 張玉騰
雜: PYTHON上數據儲存:推薦h5py -- Pony_s