Python:Numpy庫基礎分析——詳解datetime類型的處理數組
關於時間的處理,Python中自帶的處理時間的模塊就有time 、datetime、calendar,另外還有擴展的第三方庫,如dateutil等等。經過這些途徑能夠爲所欲爲地用Python去處理時間。當咱們用NumPy庫作數據分析時,如何轉換時間呢?bash
在NumPy 1.7版本開始,它的核心數組(ndarray)對象支持datetime相關功能,因爲’datetime’這個數據類型名稱已經在Python自帶的datetime模塊中使用了, NumPy中時間數據的類型稱爲’datetime64’。函數
單個時間格式字符串轉換爲numpy的datetime對象,可以使用datetime64實例化一個對象,以下所示:ui
#時間字符串轉numpy.datetime64
datetime_nd=np.datetime64('2019-01-01')
print(type(datetime_nd))#<class 'numpy.datetime64'>
複製代碼
反過來numpy的datetime對象轉換爲時間格式字符串,可以使用datetime_as_string()函數,以下所示:spa
#numpy.datetime64轉時間字符串
datetime_str=np.datetime_as_string(datetime_nd)
print(type(datetime_str))#<class 'numpy.str_'>
複製代碼
從時間格式字符串數組去建立numpy的datetime對象數組(array)時,能夠直接使用numpy.array()函數,指定dtype爲’datetime64’,這樣的話數組中的元素爲’datetime64’類型,以下所示:code
datetime_array = np.array(['2019-01-05','2019-01-02','2019-01-03'], dtype='datetime64')
print(datetime_array)#['2019-01-05' '2019-01-02' '2019-01-03']
print(type(datetime_array))#<class 'numpy.ndarray'>
print(type(datetime_array[0]))#<class 'numpy.datetime64'>
複製代碼
也能夠經過numpy.arange()函數,給定時間起始範圍去建立numpy的datetime對象數組(array),指定dtype爲’datetime64’時默認以日爲時間間隔,以下所示:cdn
datetime_array = np.arange('2019-01-05','2019-01-10', dtype='datetime64')
print(datetime_array)#['2019-01-05' '2019-01-06' '2019-01-07' '2019-01-08' '2019-01-09']
複製代碼
設定numpy.arange()函數中的dtype參數,能夠調整時間的間隔,好比以年、月、周,甚至小時、分鐘、毫秒程度的間隔生成時間數組,這點和Python的datetime模塊是同樣的,分爲了date單位和time單位。以下所示:對象
# generate year datetime array
datetime_array = np.arange('2018-01-01','2020-01-01', dtype='datetime64[Y]')
print(datetime_array)#['2018' '2019']
# generate month datetime array
datetime_array = np.arange('2019-01-01','2019-10-01', dtype='datetime64[M]')
print(datetime_array)#['2019-01' '2019-02' '2019-03' '2019-04' '2019-05' '2019-06' '2019-07' '2019-08' '2019-09']
# generate week datetime array
datetime_array = np.arange('2019-01-05','2019-02-10', dtype='datetime64[W]')
print(datetime_array)#['2019-01-03' '2019-01-10' '2019-01-17' '2019-01-24' '2019-01-31']
# generate ms datetime array
datetime_array = np.arange('2019-01-05','2019-01-10', dtype='datetime64[ms]')
print(datetime_array)
#['2019-01-05T00:00:00.000' '2019-01-05T00:00:00.001'
# '2019-01-05T00:00:00.002' ... '2019-01-09T23:59:59.997'
# '2019-01-09T23:59:59.998' '2019-01-09T23:59:59.999']
複製代碼
將numpy.datetime64轉化爲datetime格式轉換爲datetime格式,可以使用astype()方法轉換數據類型,以下所示:blog
#numpy.datetime64轉化爲datetime格式
datetime_df=datetime_nd.astype(datetime.datetime)
print(type(datetime_df))#<class 'datetime.date'>
複製代碼
另外,numpy也提供了datetime.timedelta類的功能,支持兩個時間對象的運算,獲得一個時間單位形式的數值。由於numpy的核心數組(ndarray)對象沒有物理量系統(physical quantities system),因此建立了timedelta64數據類型來補充datetime64。datetime和timedelta結合提供了更簡單的datetime計算方法。以下所示:字符串
# numpy.datetime64 calculations
datetime_delta = np.datetime64('2009-01-01') - np.datetime64('2008-01-01')
print(datetime_delta)#366 days
print(type(datetime_delta))#<class 'numpy.timedelta64'>
datetime_delta = np.datetime64('2009') + np.timedelta64(20, 'D')
print(datetime_delta)#2009-01-21
datetime_delta = np.datetime64('2011-06-15T00:00') + np.timedelta64(12, 'h')
print(datetime_delta)#2011-06-15T12:00
datetime_delta = np.timedelta64(1,'W') / np.timedelta64(1,'D')
print(datetime_delta)#7.0
複製代碼
你們有哪些地方不清楚的,能夠留言哦!