# 導入基礎數據分析模塊包html
import numpy as np
import pandas as pd
from pandas import Series, DataFrame
import matplotlib.pyplot as pltorm
# 忽略警告 htm
import warnings
warnings.filterwarnings('ignore')內存
# 顯示全部列
pd.set_option('display.max_columns', None)
#顯示全部行
pd.set_option('display.max_rows', None)字符串
# 字符串列轉日期列數據分析
df["datetime_col"] = pd.to_datetime(df["datetime_col"], format='%Y/%m/%d')pandas
# 查看樣本的數和特徵列數
print(df.shape)
# 查看數據基本行列大小、類型、內存信息
df.info()io
# 生成數據報表並保存
import pandas_profiling
profile = pandas_profiling.ProfileReport(df)
profileform
# 保存數據報表import
profile.to_file(outputfile = "output_file.html")
# 統計數值型 describe()df.describe().T