pandas - 案例(美國各州人口普查)

需求:spa

  • 導入文件,查看原始數據
  • 將人口數據和各州簡稱數據進行合併
  • 將合併的數據中重複的abbreviation列進行刪除
  • 查看存在缺失數據的列
  • 找到有哪些state/region使得state的值爲NaN,進行去重操做
  • 爲找到的這些state/region的state項補上正確的值,從而去除掉state這一列的全部NaN
  • 合併各州面積數據areas
  • 咱們會發現area(sq.mi)這一列有缺失數據,找出是哪些行
  • 去除含有缺失數據的行
  • 找出2010年的全民人口數據
  • 計算各州的人口密度
  • 排序,並找出人口密度最高的五個州 df.sort_values()

 

 

1. 導入文件,查看原始數據3d

import numpy as np
from pandas import DataFrame,Series
import pandas as pd

2. 將人口數據和各州簡稱數據進行合併code

 

3. 將合併的數據中重複的abbreviation列進行刪除blog

 

4. 查看存在缺失數據的列排序

 

5. 找到有哪些state/region使得state的值爲NaN,進行去重操做pandas

 

6. 爲找到的這些state/region的state項補上正確的值,從而去除掉state這一列的全部NaNio

 

7. 合併各州面積數據areasclass

 

8. 咱們會發現area(sq.mi)這一列有缺失數據,找出是哪些行import

 

9. 去除含有缺失數據的行numpy

 

10. 找出2010年的全民人口數據

 

11. 計算各州的人口密度

 

12. 排序,並找出人口密度最高的五個州 df.sort_values()

相關文章
相關標籤/搜索