《數據可視化基礎》第五章:可視化數量(一)


如下部分是基於《Fundamentals of Data Visualization》學習筆記,要是有興趣的話,能夠直接看原版書籍: https://serialmentor.com/dataviz/





在許多狀況下,咱們對某些數字的大小感興趣。 例如,咱們可能但願可視化不一樣品牌汽車的總銷量,或 生活在 不一樣城市的總人數,或進行不一樣運動的奧林匹克運動員的年齡。 在全部這些狀況下,咱們都有 一組類別(例如,汽車,城市或運動品牌)以及每一個類別的定量值 咱們講這種的數據類 型的可視化稱爲數量可視化。 對於這種的可視化,最基本的就是條形圖以及各類變體的條形圖,另外還有熱圖。

條形圖


爲了說明條形圖,咱們使用2017年聖誕週末的電影票房來舉例子。在這個數據當中,包含了每個電影的名稱以及他們的總票房。web

對於這樣的數據,咱們使用垂直的條形圖來進行表示。對於每個電影,咱們繪製一個從0到具體數值的一個矩形(條形),利用這個矩形塊來表明某一個數值。數據庫



對於垂直的條形圖而言,X軸對於每個條形的標註佔據了很大的空間。這樣就致使不一樣的條之間會有很大的空白。爲了解決的這個問題,不少人會把標註進行旋轉。這樣會減小之間的空間。可是不是很建議這麼作,由於旋轉的標註對於閱讀而言是很麻煩的,另外的話,根據做者的經驗,若是標籤太長水平沒法放下的話,旋轉的效果也不是很好。微信

對於這種長標籤,最好的解決辦法仍是把X軸和Y軸調換。造成一個水平的條形圖app



另外不管是垂直仍是水平的條形圖,都須要注意排列的順序。咱們在使用繪圖軟件進行繪圖的時候,不少繪圖軟件的默認排序是基於標註的字母順序來進行排序的。這個的順序的話,雖然可行,可是會看着很很差看。因此若是是對於若是沒有必定順序的數據的話,最好仍是按照具體數值進行降序或者升序,例如👆的圖。學習

以上的規則只是適用於沒有天然排序的狀況下,若是是有天然排序的話,必定要按照天然排序來進行排序的。例如,下圖顯示了按年齡段劃分的美國年收入中位數。在這種狀況下,應按年齡增長的順序排列。若是這個時候,對年齡組按條形高度進行排序是沒有意義的。flex

分組和堆疊的條形圖


在上面的例子當中,咱們遇到的都是一個分類變量與其相關的變量變化。可是,咱們常常也會同時對兩個分類變量的數據變化感興趣。例如,美國人口普查局提供了按年齡和種族細分的收入中位數。這個時候,咱們可使用分組條形圖來進行可視化。在分組的條形圖當中,咱們把其中一個變量看成X軸標註,而後利用另一個分類變量來繪製多個條形。spa


對於分組的條形圖,因爲分組太多就容易致使混淆。這類的可視化,都是基於咱們想要講述的內容來進行調整的。例如咱們是不一樣年齡段的種族之間的差別感興趣的話,可使用👆的圖。若是是咱們對不一樣種族之間的總體收入變化的話,那可使用下面的圖。.net



上面的兩種分組可視化,咱們是經過把兩個分類變量映射到X軸和顏色標度上來實現的,還有另一種方式是利用一個分類變量來進行分面進而繪製多個條形圖。兩種可視化方式都對,只不過度面的好處是咱們不須要來花費額外的精力去解讀具體的分組的變量是什麼了。3d

相較於上面並排的條形圖,還有一種分組的條形圖是堆疊在一塊兒的。這種堆疊的條形圖對於想要說明總體變化的時候是有用的。orm


PS:👆顯示的條形圖沒有明確的y軸。相反,在每一個條形中標註了其所表明的實際數值。每當一個圖只顯示少許數值時,將實際數字添加到圖中是有意義的。這實質上增長了繪圖傳達的信息量,而沒有增長太多視覺噪聲,而且消除了對顯式y軸的須要。


後記


上面咱們介紹了基本的條形的類型。可是對於條形圖而言還有兩個弊端:(i)若是咱們想要可視化的數據總體之間的差別沒那麼大,那應該怎麼展現結果呢?(ii)對於分組的條形圖,若是分組太多,要怎麼辦呢?針對這兩個問題,咱們有二者候選的圖形能夠進行替代,咱們下期再講哦!

往期推薦 《數據可視化基礎》第四章:可視化圖形推薦 《數據可視化基礎》第三章:圖形顏色如何選擇 《數據可視化基礎》第二章:座標軸 《數據可視化基礎》第一章:把數據放到圖表上

本文分享自微信公衆號 - 醫學數據庫百科(yxkygjx)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索