pandas缺失值處理之——如何消去Nan值對數字型字符串數據類型的影響,讓數字型字符串保持原始str類型,而不會自動變爲float類型?

在利用pandas處理表格時,每每有時咱們用表格作的測試用例每每會設計考一些必填項*故意賦值爲空(表明不輸入)的測試用例,測試

好比說咱們的手機號、身份證號碼、社會統一信用代碼等都是數字型字符串。以下所示:spa

pandas讀取表格,會把表格中的空單元格置爲float類型的Nan值,會致使數字型字符串列的數據類型從原始的str類型自動轉換爲float類型,以下圖所示:設計

讀取的效果:3d

從上圖可看出,pandas讀取excel時,遇到空白單元格會自動置爲nan值,float型。excel

致使原始表格中的文本類型的social_code(社會信用代碼)和 telno(手機號)從原始的本文str類型轉變爲了float類型,致使數據顯示錯誤,不是咱們想要的結果。code

 

那如何將nan值所有置爲空,而且還不會影響原始表格中的數字型字符串呢???blog

咱們能夠在讀取表格時,就以字符串型讀取,以下圖所示:ci

效果以下:字符串

這時,原始的數字型字符串數據就不會受到nan值的影響了。pandas

若是須要對nan值進行替換,直接採用fillna()填充便可。

 

替換、填充效果:

 

這樣就完成了~~~~

相關文章
相關標籤/搜索