臨時處理一個Numpy的二進制文件,分析知道里面是dict類型,簡單小記一下,若是Numpy和Python基礎不熟悉能夠看我以前寫的文章html
%%time
import numpy as np
%%time
import pandas as pd
%%time
df = pd.DataFrame(np.load("data.npy")) # 經過narry建立DataFrame
%%time
df.head(10) # 快速預覽前10行
%%time
# 提取email列
df['Email'] = df[0].map(lambda x : dict(x)["email"])
# 提取pwd列
df['MD5'] = df[0].map(lambda x : dict(x)["pwd"] )
# 刪除無用列
del df[0]
%%time
df.size # 查看總共多少數據
%%time
df.shape
%%time
df.head(10)
%%time
df.T.to_json("user.json") # 從新保存爲Json(轉置只是爲了存儲成咱們常見的json格式)
關於怎麼知道是dict類型的擴展:能夠加載看看:np.load("data.npy")
python