需求:spa
1. 導入文件,查看原始數據3d
import numpy as np from pandas import DataFrame,Series import pandas as pd
2. 將人口數據和各州簡稱數據進行合併code
3. 將合併的數據中重複的abbreviation列進行刪除blog
4. 查看存在缺失數據的列排序
5. 找到有哪些state/region使得state的值爲NaN,進行去重操做pandas
6. 爲找到的這些state/region的state項補上正確的值,從而去除掉state這一列的全部NaNio
7. 合併各州面積數據areasclass
8. 咱們會發現area(sq.mi)這一列有缺失數據,找出是哪些行import
9. 去除含有缺失數據的行numpy
10. 找出2010年的全民人口數據
11. 計算各州的人口密度
12. 排序,並找出人口密度最高的五個州 df.sort_values()