『Numpy』內存分析_numpy.dtype解析內存數據

numpy.dtype用於自定義數據類型,實際是指導python程序存取內存數據時的解析方式。python

【注意】,更改格式不能使用 array.dtype=int32 這樣的硬性更改,會不改變內存直接該邊解析過程,致使讀取出問題,因此使用 array.astype(int32) ,這樣才安全。數組

1、基本使用示例

// 定義一個數據類型,其中name爲16爲字符串,grades爲2個float64的子數組
>>> dt = np.dtype([('name', np.str_, 16), ('grades', np.float64, (2,))])
>>> dt['name']
dtype('<U16')
>>> dt['grades']
dtype(('<f8',(2,)))

// 調用方法查看數組
>>> x = np.array([('Sarah', (8.0, 7.0)), ('John', (6.0, 7.0))], dtype=dt)
>>> x[1]
('John', [6.0, 7.0])
>>> x[1]['grades']
array([ 6.,  7.])
>>> type(x[1])
<type 'numpy.void'>
>>> type(x[1]['grades'])
<type 'numpy.ndarray'>

 

2、dtype複雜格式概覽

一、(flexible_dtype, itemsize):不指定大小的數據類型,大小

>>> dt = np.dtype((void, 10))  # 10位緩存區對象
>>> dt = np.dtype((str, 35))   # 35字符字符串
>>> dt = np.dtype(('U', 10))   # 10字符unicode string

 二、(fixed_dtype, shape):固定大小的類型,個數

>>> dt = np.dtype((np.int32, (2,2)))          # 2*2int子數組
>>> dt = np.dtype(('S10', 1))                 # 10字符字符串
>>> dt = np.dtype(('i4, (2,3)f8, f4', (2,3))) # 2x3結構子數組

三、[(field_name, field_dtype, field_shape), …]:字段名,格式(含類型大小),個數

文首示例中的例子即爲此種狀況緩存

>>> dt = np.dtype([('big', '>i4'), ('little', '<i4')])
>>> dt = np.dtype([('R','u1'), ('G','u1'), ('B','u1'), ('A','u1')])

四、{‘names’: …, ‘formats’: …, ‘offsets’: …, ‘titles’: …, ‘itemsize’: …}:同上,使用字典來表達,且定製程度更高

>>> dt = np.dtype({'names': ['r','g','b','a'],'formats': [uint8, uint8, uint8, uint8]})

五、{‘field1’: …, ‘field2’: …, …}: 同上

// col1在字節0處,col2在字節10處,col3在字節14處
>>> dt = np.dtype({'col1': ('S10', 0), 'col2': (float32, 10),'col3': (int, 14)})

 

3、獲取數組的dtype

數組的.dtype返回4的格式,將屬性做爲條目展現安全

數組的.dtype.fields會進一步轉換爲5的格式,更強調字段,將之做爲條目展現bash

persontype = np.dtype({
    'names':['name','age','weight','height'],
    'formats':['S30','i','f','f']}, align=True)
a = np.array([('Zhang',32,72.5,167),
              ('Wang',24,65,170)],dtype=persontype)

print(a.dtype)
#dtype({'names':['name','age','weight','height'], 
#       'formats':['S30','<i4','<f4','<f4'], 
#       'offsets':[0,32,36,40], 
#       'itemsize':44}, 
#       align=True)


print(a.dtype.fields)
# mappingproxy({'age': (dtype('int32'), 32),
#               'height': (dtype('float32'), 40),
#               'name': (dtype('S30'), 0),
#               'weight': (dtype('float32'), 36)})

 

4、簡單數據格式

int32,big-edian 以及 little-endianapp

>>> dt = np.dtype('>i4')  定義一個big-endian int 4*8=32位的數據類型
>>> dt
dtype('>i4')
>>> dt.byteorder    //字節順序:>爲big-edian <爲little-endian 
'>'
>>> dt.itemsize    //字節大小
4
>>> dt.name       //dt類型
'int32'
>>> dt.type is np.int32
True

 

簡略字符參flex

'b' boolean 'i' (signed) integer 'u' unsigned integer 'f' floating-point 'c' complex-floating point 'm' timedelta 'M' datetime 'O' (Python) objects 'S', 'a' (byte-)string 'U' Unicode 'V' raw data (void)

 

混編格式ui

[個數] | 類型 | 字節數spa

// 3字節字符串、3個8字節整型子數組、3*4的10字節字符串數組
np.dtype("a3, 3u8, (3,4)a10")
相關文章
相關標籤/搜索