pandas

 

# 導入基礎數據分析模塊包html

import numpy as np
import pandas as pd
from pandas import Series, DataFrame
import matplotlib.pyplot as pltorm

# 忽略警告 htm

import warnings
warnings.filterwarnings('ignore')內存

 

# 顯示全部列
pd.set_option('display.max_columns', None)
#顯示全部行
pd.set_option('display.max_rows', None)字符串

 

# 字符串列轉日期列數據分析

df["datetime_col"] = pd.to_datetime(df["datetime_col"], format='%Y/%m/%d')pandas

# 查看樣本的數和特徵列數
print(df.shape)
# 查看數據基本行列大小、類型、內存信息
df.info()io

 

# 生成數據報表並保存
import pandas_profiling

profile = pandas_profiling.ProfileReport(df)
profileform

# 保存數據報表import

profile.to_file(outputfile =  "output_file.html")

 

# 統計數值型 describe()df.describe().T

相關文章
相關標籤/搜索
本站公眾號
   歡迎關注本站公眾號,獲取更多信息