數據可視化：基本圖表

時間 2019-11-14

標籤數據可視化基本圖表简体版

原文原文鏈接

本文轉自阮一峯 http://www.ruanyifeng.com/blog/2014/11/basic-charts.htmlhtml

"數據可視化"能夠幫助用戶理解數據，一直是熱門方向。大數據

圖表是"數據可視化"的經常使用手段，其中又以基本圖表----柱狀圖、折線圖、餅圖等等----最爲經常使用。spa

用戶很是熟悉這些圖表，但若是被問道，它們的特色是什麼，最適用怎樣的場合（數據集）？恐怕答得上來的人就很少了。htm

本文是電子書《Data Visualization with JavaScript》第一章的筆記，總結了六種基本圖表的特色和適用場合，很是好地回答了上面的問題。blog

零、序言

進入正題以前，先糾正一種誤解。排序

有人以爲，基本圖表太簡單、太原始，不高端，不大氣，所以追求更復雜的圖表。可是，越簡單的圖表，越容易理解，而快速易懂地理解數據，不正是"數據可視化"的最重要目的和最高追求嗎？ip

因此，請不要小看這些基本圖表。由於用戶最熟悉它們，因此只要是適用的場合，就應該考慮優先使用。get

柱狀圖是最多見的圖表，也最容易解讀。it

它的適用場合是二維數據集（每一個數據點包括兩個值x和y），但只有一個維度須要比較。年銷售額就是二維數據，"年份"和"銷售額"就是它的兩個維度，但只須要比較"銷售額"這一個維度。io

柱狀圖利用柱子的高度，反映數據的差別。肉眼對高度差別很敏感，辨識效果很是好。柱狀圖的侷限在於只適用中小規模的數據集。

一般來講，柱狀圖的X軸是時間維，用戶習慣性認爲存在時間趨勢。若是遇到X軸不是時間維的狀況，建議用顏色區分每根柱子，改變用戶對時間趨勢的關注。

上圖是英國足球聯賽某個年度各隊的贏球場數，X軸表明不一樣球隊，Y軸表明贏球數。

折線圖適合二維的大數據集，尤爲是那些趨勢比單個數據點更重要的場合。

它還適合多個二維數據集的比較。

上圖是兩個二維數據集（大氣中二氧化碳濃度，地表平均氣溫）的折線圖。

餅圖是一種應該避免使用的圖表，由於肉眼對面積大小不敏感。

上圖中，左側餅圖的五個色塊的面積排序，不容易看出來。換成柱狀圖，就容易多了。

通常狀況下，老是應該用柱狀圖替代餅圖。可是有一個例外，就是反映某個部分佔總體的比重，好比貧窮人口占總人口的百分比。

散點圖適用於三維數據集，但其中只有兩維須要比較。

上圖是各國的醫療支出與預期壽命，三個維度分別爲國家、醫療支出、預期壽命，只有後兩個維度須要比較。

爲了識別第三維，能夠爲每一個點加上文字標示，或者不一樣顏色。

氣泡圖是散點圖的一種變體，經過每一個點的面積大小，反映第三維。

上圖是卡特里娜颶風的路徑，三個維度分別爲經度、緯度、強度。點的面積越大，就表明強度越大。由於用戶不善於判斷面積大小，因此氣泡圖只適用不要求精確辨識第三維的場合。

若是爲氣泡加上不一樣顏色（或文字標籤），氣泡圖就可用來表達四維數據。好比下圖就是經過顏色，表示每一個點的風力等級。

雷達圖適用於多維數據（四維以上），且每一個維度必須能夠排序（國籍就不能夠排序）。可是，它有一個侷限，就是數據點最多6個，不然沒法辨別，所以適用場合有限。

下面是邁阿密熱火隊首發的五名籃球選手的數據。除了姓名，每一個數據點有五個維度，分別是得分、籃板、助攻、搶斷、封蓋。

畫成雷達圖，就是下面這樣。

面積越大的數據點，就表示越重要。很顯然，勒布朗·詹姆斯（紅色區域）是熱火隊最重要的選手。

須要注意的時候，用戶不熟悉雷達圖，解讀有困難。使用時儘可能加上說明，減輕解讀負擔。