本文對應代碼和數據已上傳至個人
Github
倉庫https://github.com/CNFeffery/DataScienceStudyNoteshtml
1 簡介
經過前面的文章,咱們已經對geopandas
中的數據結構、座標參考系以及文件IO有了較爲深刻的學習,在拿到一份矢量數據開始分析時,對其進行可視化無疑是探索瞭解數據階段重要的步驟。git
做爲基於geopandas的空間數據分析系列文章的第四篇,經過本文你將會學習到基於geopandas
的基礎可視化。github
2 基礎可視化
geopandas
使用matplotlib
做爲繪圖後端,使用plot()
方法對GeoSeries
或GeoDataFrame
進行可視化,簡簡單單便可完成基本的可視化,再結合上matplotlib
的一些額外元素補充,即可以建立出更加精美的可視化做品,下面咱們分別進行介紹。web
2.1 GeoSeries
GeoSeries
因爲僅有單獨一列幾何對象,無對應的數值故不涉及數值向視覺元素的映射,所以可視化相對簡單,下面咱們先來看看GeoSeries.plot()
的經常使用的參數有哪些,若是你已經對matplotlib
有必定了解,想必理解這些參數起來會更加輕鬆:後端
figsize:傳入(寬度, 高度)形式的元組或列表,用於控制繪製出圖像的寬度和高度,單位均爲英寸數據結構
facecolor:設置幾何對象的填充色,可接受顏色名稱和十六進制色彩,設置爲'none'時不填充顏色app
edgecolor:設置幾何對象的邊界色,對面數據和點數據效果較爲明顯,不建議對線數據設置該參數,傳入格式同facecoloride
linewidth:設置幾何對象邊界寬度,對面數據和點數據效果較爲明顯,不建議對線數據設置該參數學習
linestyle:字符串類型,用於設置幾何對象邊界及線數據的線型字體
markersize:設置點數據的大小
marker:字符串類型,用於設置點數據的形狀
alpha:設置對應幾何對象全局的色彩透明度,0-1,越大越不透明
label:適用於純粹的線數據或點數據,在須要添加圖例時適用,用做各個對象在圖例中顯示的名稱
hatch:字符型,用於設置面數據內部的填充線樣式下文的例子中將具體舉例說明
ax:
matplotlib
座標軸對象,若是須要在同一個座標軸內疊加多個圖層就須要用這個參數傳入先前待疊加的ax
下面咱們從實際例子上手,深刻理解上述各參數,咱們使用到的數據china-shapefiles.zip
爲中國國土+南海九段線,你能夠在本文開頭列出的Github
倉庫對應本文的路徑下找到它。
首先利用上一篇文章介紹的讀取.zip
文件中數據的方法,將咱們所需的陸地及九段線數據分別讀入(其中因爲原始數據china.shp
中每一個要素不是單獨的省份而是面,即有的包含衆多島嶼的省份會由若干行共同構成,所以使用geopandas
地理操做中的融合dissolve()
按照OWNER
列融合分離的面爲多面,從而使得每一行是對應的完整的省份,關於更多地理操做將會在後續的對應的文章介紹):
import geopandas as gpd import matplotlib.pyplot as plt # 設置matplotlib繪圖模式爲嵌入式 %matplotlib inline plt.rcParams["font.family"] = "SimHei" # 設置全局中文字體爲黑體 # 讀入中國領土面數據 china = gpd.read_file('zip://china-shapefiles.zip!china-shapefiles/china.shp', encoding='utf-8') # 因爲每行數據是單獨的面,所以按照其省份列OWNER融合 china = china.dissolve(by='OWNER').reset_index(drop=False) # 讀入南海九段線線數據 nine_lines = gpd.read_file('zip://china-shapefiles.zip!china-shapefiles/china_nine_dotted_line.shp', encoding='utf-8')
用plot()
方法疊加繪製不帶任何個性化參數的原始地圖(CRS
爲EPSG:4326即WGS84):
# 初始化圖牀 fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.plot(ax=ax) ax = nine_lines.geometry.plot(ax=ax) fig.savefig('圖1.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
接下來咱們一步一步,將適用於GeoSeries.plot()
的參數展現運用:
- Step1:選擇合適的投影
在以前關於座標參考系的文章中咱們瞭解過繪製地圖時投影的重要性,參考超圖對繪製中國地圖投影選用方面的建議(http://support.supermap.com.cn/datawarehouse/webdochelp/idesktop/features/Visualization/MapSetting/ChooseAMapProjection.htm),咱們使用繪製中國地圖經常使用的Albers Equal Area做爲投影,在https://proj.org/operations/projections/aea.html查詢到其信息說明:
![](http://static.javashuo.com/static/loading.gif)
將其proj
信息傳入to_crs()
方法中(注意按照將添加上中央經線105度和標準緯度範圍25到47度),統一到全部圖層中:
# 定義CRS albers_proj = '+proj=aea +lat_1=25 +lat_2=47 +lon_0=105' fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax) fig.savefig('圖3.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
這時的形狀較爲接近真實狀況,看起來也比較天然。
- Step2:修改顏色
下面咱們來調整面數據的填充色與輪廓色,線數據(九段線)的色彩,並分別設置透明度alpha
,這裏爲了美觀,將座標軸順便移除:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', alpha=0.4) ax.axis('off') # 移除座標軸 fig.savefig('圖4.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
- Step3:修改線型與線寬
接下來咱們在圖4的基礎上,修改線型和線寬,其中線型參數linestyle
與matplotlib
徹底一致,不一樣選擇對應樣式如圖5:
![](http://static.javashuo.com/static/loading.gif)
參考圖5,咱們維持九段線線型不變但適當增大其寬度爲3,面數據的輪廓則設置爲'--'
:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') # 移除座標軸 fig.savefig('圖6.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
- Step4:修改面填充陰影線樣式
接下來咱們利用hatch
參數來修改面數據填充陰影樣式,主要樣式對應以下,如'-'
表明橫線填充:
![](http://static.javashuo.com/static/loading.gif)
參考圖7,咱們設置面數據的填充陰影樣式爲'x'
,值得一提的是,hatch
參數對於同一種陰影模式,能夠經過增長字符數量來提升陰影密度,以下圖是hatch='x'
時:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', hatch='x', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') # 移除座標軸 fig.savefig('圖8.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
而hatch='xxxx'
時繪製出的地圖以下:
![](http://static.javashuo.com/static/loading.gif)
更有意思的是,不一樣陰影模式能夠混合在一塊兒,譬如咱們下面設置hatch='x**'
:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', hatch='x**', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') # 移除座標軸 fig.savefig('圖10.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
- Step5:點數據個性化
GeoSeries.plot()
中的markersize
和marker
專門針對點數據進行配置,但是咱們的數據裏並無點數據,爲了舉例說明,下面咱們來從已有的數據中生成點數據,我最開始的想法是爲每一個面生成重心,做爲每一個省份的中心點:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', hatch='xxxx', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax = china.geometry.centroid.to_crs(albers_proj).plot(ax=ax, facecolor='black') ax.axis('off') # 移除座標軸 fig.savefig('圖11.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
可是細心觀察能夠發現,有些省份的重心很尷尬地落在外面,譬如甘肅省,由於它是一個很是典型的非凸多邊形(凸多邊形內部任意兩點間連線都不會穿過其邊界),所以計算出來的重心落在了外部,好在geopandas
爲咱們提供了representative_point()
方法,用於求出任意多邊形內部的一個典型點:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', hatch='xxxx', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax = china.geometry.representative_point() \ .to_crs(albers_proj) \ .plot(ax=ax, facecolor='black') ax.axis('off') # 移除座標軸 fig.savefig('圖12.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
這時能夠發現生成的點符合了咱們的需求,下面咱們爲此基礎上,利用marker
調整點數據的樣式,參考圖13:
![](http://static.javashuo.com/static/loading.gif)
譬如咱們將marker
修改成'*'
,並調整相關的其餘參數使得點看起來更加明顯:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', hatch='xxxx', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax = china.geometry.representative_point() \ .to_crs(albers_proj) \ .plot(ax=ax, facecolor='white', edgecolor='black', marker='*', markersize=200, linewidth=0.5) ax.axis('off') # 移除座標軸 fig.savefig('圖14.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
- Step6:圖例與文字標註
接下來咱們來學習如何爲地圖添加圖例和文字標註,爲了看着清楚咱們移除陰影填充並下降點的大小,而後爲九段線與點數據添加參數label
,最後使用ax.legend()
添加圖例並設置相應參數:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4, label='南海九段線') ax = china.geometry.representative_point() \ .to_crs(albers_proj) \ .plot(ax=ax, facecolor='white', edgecolor='black', marker='*', markersize=100, linewidth=0.5, label='省級單位') # 單獨提早設置圖例標題大小 plt.rcParams['legend.title_fontsize'] = 14 # 設置圖例標題,位置,排列方式,是否帶有陰影 ax.legend(title="圖例", loc='lower left', ncol=1, shadow=True) ax.axis('off') # 移除座標軸 fig.savefig('圖15.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
接下來咱們把標記每一個省級單位的星星換成名稱文字,這裏使用到matplolib
中的text()
方法,其以此傳入對應循環到的點的x、y、文字內容,ha
與va
用於調整文字水平和豎直對齊方式,size
調整文字大小,更具體的參數能夠去matplotlib
官網搜索查看,本文不作重點介紹:
fig, ax = plt.subplots(figsize=(12, 8)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4, label='南海九段線') # 根據轉換過投影的表明點,循環添加文字至地圖上對應位置 for idx, _ in enumerate(china.geometry.representative_point().to_crs(albers_proj)): # 提取省級單位簡稱 if ('自' in china.loc[idx, 'OWNER'] or '特' in china.loc[idx, 'OWNER']) \ and china.loc[idx, 'OWNER'] != '內蒙古自治區': region = china.loc[idx, 'OWNER'][:2] else: region = china.loc[idx, 'OWNER'].replace('省', '') \ .replace('市', '') \ .replace('自治區', '') ax.text(_.x, _.y, region, ha="center", va="center", size=6) # 單獨提早設置圖例標題大小 plt.rcParams['legend.title_fontsize'] = 14 # 設置圖例標題,位置,排列方式,是否帶有陰影 ax.legend(title="圖例", loc='lower left', ncol=1, shadow=True) ax.axis('off') # 移除座標軸 fig.savefig('圖16.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
- Step7:添加小地圖
你們平時若是留意會記得,咱們通常看到的中國地圖其南海區域都是單獨在右下角的小地圖裏顯示出來的,在geopandas
裏製做這種地圖很是簡單,咱們只須要結合matplotlib
中添加子圖區域的add_axes()
,便可完成製做,先來認識一下add_axes()
的功能,它最重要的參數是rect
,經過傳入形如(bottom, left, width, height)
來實如今圖牀中開闢子區域,讓咱們從下面簡單的例子出發好好理解,首先咱們使用plt.figure()
建立一個方形畫布,並在畫布上使用add_axes((0, 0, 1, 1))
:
![](http://static.javashuo.com/static/loading.gif)
發現原理了嗎?咱們傳入的(0, 0, 1, 1)
,其前兩位其實表明着子圖區域左下角座標在整個畫布中的比例座標!然後兩位則表明則表明着子圖區域的相對於整個畫布的比例寬度與長度!接着咱們再爲fig
開闢新的子區域,並在新開闢的子區域正中心寫上文字:
![](http://static.javashuo.com/static/loading.gif)
新的子圖區域左下角座標位於畫布的底邊中點,比例長寬均爲0.5,因此獲得瞭如圖所示的效果,搞明白了這些以後,下面咱們就能夠來畫帶小地圖的中國地圖啦:
首先咱們須要分別對中國地圖以及南海插圖的經緯度範圍進行限定,由於並無找到嚴格的範圍規定,因此這裏咱們大體定義一下中國地圖和南海插圖的最小最大經緯度,生成GeoDataFrame
並添加矢量信息,最後進行合適的投影轉換:
from shapely.geometry import Point bound = gpd.GeoDataFrame({ 'x': [80, 150, 106.5, 123], 'y': [15, 50, 2.8, 24.5] }) # 添加矢量列 bound.geometry = bound.apply(lambda row: Point([row['x'], row['y']]), axis=1) # 初始化CRS bound.crs = 'EPSG:4326' # 再投影 bound.to_crs(albers_proj, inplace=True) bound
![](http://static.javashuo.com/static/loading.gif)
接下來的步驟就一目瞭然了,只須要把前文繪製地圖部分的手法分別移植到兩個子圖上便可:
fig = plt.figure(figsize=(8, 8)) # 建立覆蓋整個畫布的子圖1 ax = fig.add_axes((0, 0, 1, 1)) ax = china.geometry.to_crs(albers_proj).plot(ax=ax, facecolor='grey', edgecolor='white', linestyle='--', alpha=0.8) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4, label='南海九段線') # 單獨提早設置圖例標題大小 plt.rcParams['legend.title_fontsize'] = 14 # 設置圖例標題,位置,排列方式,是否帶有陰影 ax.legend(title="圖例", loc='lower left', ncol=1, shadow=True) ax.axis('off') # 移除座標軸 ax.set_xlim(bound.geometry[0].x, bound.geometry[1].x) ax.set_ylim(bound.geometry[0].y, bound.geometry[1].y) # 建立南海插圖對應的子圖,這裏的位置和大小信息是我調好的,你能夠試着調節看看有什麼不一樣 ax_child = fig.add_axes([0.75, 0.15, 0.2, 0.2]) ax_child = china.geometry.to_crs(albers_proj).plot(ax=ax_child, facecolor='grey', edgecolor='white', linestyle='--', alpha=0.8) ax_child = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax_child, edgecolor='grey', linewidth=3, alpha=0.4, label='南海九段線') ax_child.set_xlim(bound.geometry[2].x, bound.geometry[3].x) ax_child.set_ylim(bound.geometry[2].y, bound.geometry[3].y) # 移除子圖座標軸刻度,由於這裏的子圖須要有邊框,因此只移除座標軸刻度 ax_child.set_xticks([]) ax_child.set_yticks([]) fig.savefig('圖20.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
2.2 GeoDataFrame
介紹完了圍繞GeoSeries
展開的繪圖方法,下面咱們來學習geopandas
中圍繞GeoDataFrame
展開的可視化方法。
與GeoSeries
相比,GeoDataFrame
擁有多列數據,即咱們能夠將輔助列的數值信息映射到地圖的視覺元素上,所以在GeoSeries
經常使用參數的基礎上,新增了更多參數:
column:用於指定映射地圖視覺元素的數值信息,能夠是對應
GeoDataFrame
的列名,或是直接傳入與幾何對象一一對應得數值序列,默認爲Nonecmap:傳入映射視覺元素時的色彩方案,具體使用方式下文中會作詳細介紹
categorical:bool型,True表示指定映射目標列採起離散表示,對於數值型的列有意義,當對應目標列爲類別型時自動變爲True
legend:bool型,爲True時會爲地圖添加圖例
scheme:str型,用於指定地區分佈圖分層設色的數值劃分方案,下文中會作詳細介紹
k:int型,用於指定分層設色的色階數量
vmin:None或float,用於指定分層設色的數值範圍下限,默認爲None即以對應數據中的最小值爲下限
vmax:None或float,用於指定分層設色的數值範圍上限,默認爲None即以對應數據中的最大值爲上限
legend_kwds:字典型,傳入與圖例相關的個性化參數
classification_kwds:字典型,傳入與分層設色相關的個性化參數
missing_kwds:字典型,傳入與缺失值處理相關的個性化參數,用於對缺失值部分的視覺映射作個性化設置
一樣的,咱們以實際例子出發,這裏咱們使用新冠肺炎疫情數據,數據來源:https://github.com/BlankerL/DXY-COVID-19-Data ,一樣地你能夠在本文開頭列出的Github
倉庫中對應本文的路徑下找到下文所使用的數據,首先咱們先對原數據作一些預處理,以獲得每一個省份最新一次更新記錄的數據:
![](http://static.javashuo.com/static/loading.gif)
這樣就獲得咱們所需的數據。
2.2.1 地區分佈圖與分層設色
地區分佈圖(Choropleth Map),指的是依據指定屬性進行層次劃分,並將對應的層次映射到對應幾何對象的色彩之上,下面咱們先將上面處理好的表格數據與china
相關聯,由於geopandas
支持pandas
的鏈接操做,因此咱們使用pd.merge()
以省級單位名稱爲鍵來鏈接兩張表(因爲鏈接以後的表格會變成pandas.DataFrame
,因此這裏將其轉換回GeoDataFrame
):
data_with_geometry = pd.merge(left=temp.replace('澳門', '澳門特別行政區'), right=china, left_on='provinceName', right_on='OWNER', how='right' ).loc[:, ['provinceName', 'provinceEnglishName', 'province_confirmedCount', 'province_suspectedCount', 'province_curedCount', 'province_deadCount', 'geometry' ]] # 將數據從DataFrame轉換爲GeoDataFrame data_with_geometry = gpd.GeoDataFrame(data_with_geometry, crs='EPSG:4326') data_with_geometry.head()
![](http://static.javashuo.com/static/loading.gif)
有了數據,咱們先很「愚蠢魯莽」地直接將province_confirmedCount
即地區確診數做爲映射值傳入參數column
,並選擇cmap
爲經典的Reds
紅色漸變配色,以及調整一些前文中咱們已經很熟悉的參數,看看獲得什麼樣的結果:
![](http://static.javashuo.com/static/loading.gif)
爲何會獲得這樣奇怪的結果?讓咱們逐一來分析一下問題所在:
- 臺灣省跑哪裏去了?
細心的你必定會發現,咱們的寶島臺灣不見了,這並非咱們的幾何對象中缺失了它,一箇中國一寸土地都不可缺乏,真正使得它消失的緣由在於咱們的原始數據中其實缺失香港和臺灣的數據,咱們前面鏈接過程使用的右鏈接的方法使得咱們保留了全部的土地,可是臺灣和香港因爲數據缺失,對應數據位置是NaN,所以在數值映射到色彩的過程當中變成了默認的白色,這時候missing_kwds
參數就起到大用處了:
fig, ax = plt.subplots(figsize=(12, 12)) # 新增缺失值處理參數 ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax, column='province_confirmedCount', cmap='Reds', missing_kwds={ "color": "lightgrey", "edgecolor": "black", "hatch": "////" }) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') fig.savefig('圖24.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
在字典格式的missing_kwds
參數中,咱們用color
設置了缺失值區域的底色,用edgecolor
設置了缺失值區域的線條顏色,而且用hatch
設置了陰影填充樣式,這樣一來哪些地方缺失數據記錄就一目瞭然了。
- 爲何只有湖北省顏色這麼深?
的確,這樣的地圖給咱們的感受就是:湖北省很嚴重,其餘地方沒什麼區別嘛,咱們在圖24的基礎上加上數值-色彩參考:
fig, ax = plt.subplots(figsize=(12, 12)) ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax, column='province_confirmedCount', cmap='Reds', missing_kwds={ "color": "lightgrey", "edgecolor": "black", "hatch": "////" }, legend=True) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') fig.savefig('圖25.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
這下咱們搞清楚了,原來是由於湖北省的數據過於大,使得數值在均勻向有序色階上映射時,除湖北省以外的其餘數據都被壓縮到很是淺色的區域,這時就到了本小結的主題——分層設色,這裏就涉及到相關的核心參數scheme
以及k
,其中scheme
決定了數據分層的方法,其經過調用第三方包mapclassify
中用於給數據分層的方法),來實現geopandas
中的分層設色,譬以下面咱們在圖25的基礎上,使用咱們喜聞樂見的天然斷點法對應的'NaturalBreaks'
做爲參數,選擇分段數量k=5
,來看看會有什麼樣的效果:
fig, ax = plt.subplots(figsize=(12, 12)) ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax, column='province_confirmedCount', cmap='Reds', missing_kwds={ "color": "lightgrey", "edgecolor": "black", "hatch": "////" }, legend=True, scheme='NaturalBreaks', k=5) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') fig.savefig('圖26.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
這時能夠看到,區域顏色的分佈更加溫和,也使得咱們看出了不一樣地區在疫情嚴重程度上的區別,且由於這時變成了離散的分層,因此圖例也由比色卡變爲更爲標準的分類圖例,可是這個圖例默認在右上角,對地圖形成了較爲明顯的遮擋,下面咱們在圖26的基礎上,利用參數legend_kwds
,以及missing_kwds
參數下的label
,對其進行美化:
fig, ax = plt.subplots(figsize=(12, 12)) ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax, column='province_confirmedCount', cmap='Reds', missing_kwds={ "color": "lightgrey", "edgecolor": "black", "hatch": "////", "label": "缺失值" }, legend=True, scheme='NaturalBreaks', k=5, legend_kwds={ 'loc': 'lower left', 'title': '確診數量分級', 'shadow': True }) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') fig.savefig('圖27.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
至此咱們的地圖已經比最開始美觀了不少,再爲其添加大標題、小標題和數聽說明文字,這樣一張談不上好看但還湊合的疫情地圖便製做完畢:
fig, ax = plt.subplots(figsize=(12, 12)) ax = data_with_geometry.to_crs(albers_proj).plot(ax=ax, column='province_confirmedCount', cmap='Reds', missing_kwds={ "color": "lightgrey", "edgecolor": "black", "hatch": "////", "label": "缺失值" }, legend=True, scheme='NaturalBreaks', k=5, legend_kwds={ 'loc': 'lower left', 'title': '確診數量分級', 'shadow': True }) ax = nine_lines.geometry.to_crs(albers_proj).plot(ax=ax, edgecolor='grey', linewidth=3, alpha=0.4) ax.axis('off') plt.suptitle('新型冠狀肺炎累計確診數量地區分佈', fontsize=24) # 添加最高級別標題 plt.title('截至2020年02月27日', fontsize=18) # 添加大標題 plt.tight_layout(pad=4.5) # 調整不一樣標題之間間距 ax.text(-2800000, 1000000, '* 原始數據來源:丁香園,\n其中臺灣及香港數據缺失') # 添加數聽說明 fig.savefig('圖28.png', dpi=300)
![](http://static.javashuo.com/static/loading.gif)
2.2.2 搭配matplotlib實現創做
geopandas
雖然自帶了如此豐富的地圖繪製功能,但不少時候做圖僅僅靠它是不夠的,想要實現更加個性化的效果,須要結合matplotlib
中豐富的功能,以下圖是我隨意結合matplotlib
中的若干功能實現的個性化可視化,疊加了較多元素,因爲篇幅有限,代碼不在此放出,你能夠去文章開頭的Github
倉庫查看本文全部代碼,嘗試用你喜歡的顏色來對地圖調色:
![](http://static.javashuo.com/static/loading.gif)
2.2.3 在模仿中學習
成爲數據可視化專家不是一件容易的事,但咱們能夠先從模仿其餘大師的優秀做品出發,譬如圖30來自於Github
倉庫https://github.com/Z3tt/TidyTuesday ,這個倉庫包含了衆多基於R
的優秀做品,而圖30就是其中之一,對澳洲大火形成的影響進行可視化:
![](http://static.javashuo.com/static/loading.gif)
而下面的圖31就是我利用geopandas
對圖30的大體模仿,其中字體部分原始的R
腳本中使用ggtext
實現方便的富文本生成,而Python
中我暫時沒找到相似功能的輪子,因此這裏文字部分比較簡陋:
![](http://static.javashuo.com/static/loading.gif)
對應的代碼以下,其中使用到的矢量數據是我搜集到的精度較高的世界地圖數據:
world = gpd.read_file('world') world['SOVEREI'] smoke_list = ['Denmark', 'France', 'Spain', 'Sweden', 'Norway', 'Germany', 'Finland', 'Poland', 'Italy', 'Greenland'] burnt_list = ['Latvia'] fig, ax = plt.subplots(figsize=(8, 8)) crs = '+proj=moll +lon_0=0 +x_0=0 +y_0=0 +ellps=WGS84 +datum=WGS84 +units=m +no_defs' # 繪製過煙區域 ax = world[world['SOVEREI'].isin(smoke_list)] \ .to_crs(crs) \ .plot(ax=ax, facecolor='#d9c09e', edgecolor='#c49c67', linewidth=0.2) # 繪製拉脫維亞 ax = world[world['SOVEREI'].isin(burnt_list)] \ .to_crs(crs) \ .plot(ax=ax, facecolor='#c82626', edgecolor='#9d1e1e', linewidth=0.2) # 繪製剩餘國家 ax = world[-(world['SOVEREI'].isin(smoke_list) | world['SOVEREI'].isin(burnt_list))] \ .to_crs(crs) \ .plot(ax=ax, facecolor='lightgrey', edgecolor='grey', linewidth=0.05, alpha=0.7) ax.set_xlim([-3200000, 2300000]) ax.set_ylim([4100000, 9000000]) ax.axis('off') # 添加文字 plt.text(-3*10**6, 5.5*10**6, ''' 由2019/20澳洲大火所致使 的灌木叢、森林以及公園焚 毀面積比拉脫維亞國土還要 大,產生的濃煙也已經覆蓋 了丹麥全境(包括格陵蘭島 和法羅羣島)島嶼)、法國、 西班牙、瑞典、挪威、德國、 芬蘭、波蘭和意大利 ''', fontdict={ 'color': 'black', 'weight': 'bold', 'size': 13 }) plt.savefig('圖31.png', dpi=500)
以上就是本文的所有內容,若有筆誤望指出,接下來的文章我將會繼續介紹更高級的地圖可視化方法,敬請期待!