一、info()
二、isnull(),可與any()和all()結合使用
三、notnull()web
導入數據:
使用info()能夠查看每一列的相關信息,能夠知道每一列有多少個非空數值。
使用isnull()判斷空值,按列判斷。
使用notnull()判斷非空,按列判斷。
svg
對於缺失值,能夠丟棄處理(dropna)。
參數:3d
導入數據:
使用dropna()按行刪除缺失值。本來有1396行數據,刪除缺失值後,剩餘1098行。
設置how
設置axis = 1,只要該列有缺失值就刪除該列。
設置thresh,只要大於等於設置的值,該行纔會被保留。
xml
對於缺失值,能夠填充處理(fillna)。
參數:對象
導入數據:
使用固定值填充
根據字典填充
向上填充ffill
向下填充bfill
limit最多連續填充NaN次數
blog
describe()針對數值列和非數值列,顯示的信息不同。圖片
導入數據:
it
duplicated()發現重複值,該方法返回一個series類型對象,值爲布爾類型。
參數:
subset:指定依據哪些列來判斷是否重複,默認是全部列,即一行的全部值徹底相同視爲重複。
keep:指定標記重複記錄的規則,默認是first。ast
導入數據:
查看重複值
subset判斷只要某些列相同,則認爲是重複。
也可寫subset = (字段名1,字段名2…)
class
drop_duplicates()刪除重複值。
參數:
subset:指定依據哪些列判斷是否重複。
也可寫subset = (字段名1,字段名2…)