數據可視化:基本圖表

本文轉自阮一峯 http://www.ruanyifeng.com/blog/2014/11/basic-charts.htmlhtml

 

"數據可視化"能夠幫助用戶理解數據,一直是熱門方向。大數據

圖表是"數據可視化"的經常使用手段,其中又以基本圖表----柱狀圖、折線圖、餅圖等等----最爲經常使用。spa

用戶很是熟悉這些圖表,但若是被問道,它們的特色是什麼,最適用怎樣的場合(數據集)?恐怕答得上來的人就很少了。htm

本文是電子書《Data Visualization with JavaScript》第一章的筆記,總結了六種基本圖表的特色和適用場合,很是好地回答了上面的問題。blog

零、序言

進入正題以前,先糾正一種誤解。排序

有人以爲,基本圖表太簡單、太原始,不高端,不大氣,所以追求更復雜的圖表。可是,越簡單的圖表,越容易理解,而快速易懂地理解數據,不正是"數據可視化"的最重要目的和最高追求嗎?ip

因此,請不要小看這些基本圖表。由於用戶最熟悉它們,因此只要是適用的場合,就應該考慮優先使用。get

1、柱狀圖(Bar Chart)

柱狀圖是最多見的圖表,也最容易解讀。it

它的適用場合是二維數據集(每一個數據點包括兩個值x和y),但只有一個維度須要比較。年銷售額就是二維數據,"年份"和"銷售額"就是它的兩個維度,但只須要比較"銷售額"這一個維度。io

柱狀圖利用柱子的高度,反映數據的差別。肉眼對高度差別很敏感,辨識效果很是好。柱狀圖的侷限在於只適用中小規模的數據集。

一般來講,柱狀圖的X軸是時間維,用戶習慣性認爲存在時間趨勢。若是遇到X軸不是時間維的狀況,建議用顏色區分每根柱子,改變用戶對時間趨勢的關注。

上圖是英國足球聯賽某個年度各隊的贏球場數,X軸表明不一樣球隊,Y軸表明贏球數。

2、折線圖(Line Chart)數據

折線圖適合二維的大數據集,尤爲是那些趨勢比單個數據點更重要的場合。

它還適合多個二維數據集的比較。

上圖是兩個二維數據集(大氣中二氧化碳濃度,地表平均氣溫)的折線圖。

3、餅圖(Pie Chart)

餅圖是一種應該避免使用的圖表,由於肉眼對面積大小不敏感。

上圖中,左側餅圖的五個色塊的面積排序,不容易看出來。換成柱狀圖,就容易多了。

通常狀況下,老是應該用柱狀圖替代餅圖。可是有一個例外,就是反映某個部分佔總體的比重,好比貧窮人口占總人口的百分比。

4、散點圖(Scatter Chart)

散點圖適用於三維數據集,但其中只有兩維須要比較。

上圖是各國的醫療支出與預期壽命,三個維度分別爲國家、醫療支出、預期壽命,只有後兩個維度須要比較。

爲了識別第三維,能夠爲每一個點加上文字標示,或者不一樣顏色。

5、氣泡圖(Bubble Chart)

氣泡圖是散點圖的一種變體,經過每一個點的面積大小,反映第三維。

上圖是卡特里娜颶風的路徑,三個維度分別爲經度、緯度、強度。點的面積越大,就表明強度越大。由於用戶不善於判斷面積大小,因此氣泡圖只適用不要求精確辨識第三維的場合。

若是爲氣泡加上不一樣顏色(或文字標籤),氣泡圖就可用來表達四維數據。好比下圖就是經過顏色,表示每一個點的風力等級。

6、雷達圖(Radar Chart)

雷達圖適用於多維數據(四維以上),且每一個維度必須能夠排序(國籍就不能夠排序)。可是,它有一個侷限,就是數據點最多6個,不然沒法辨別,所以適用場合有限。

下面是邁阿密熱火隊首發的五名籃球選手的數據。除了姓名,每一個數據點有五個維度,分別是得分、籃板、助攻、搶斷、封蓋。

畫成雷達圖,就是下面這樣。

面積越大的數據點,就表示越重要。很顯然,勒布朗·詹姆斯(紅色區域)是熱火隊最重要的選手。

須要注意的時候,用戶不熟悉雷達圖,解讀有困難。使用時儘可能加上說明,減輕解讀負擔。

7、總結

圖表 維度 注意點
柱狀圖 二維 只需比較其中一維
折線圖 二維 適用於較大的數據集
餅圖 二維 只適用反映部分與總體的關係
散點圖 二維或三維 有兩個維度須要比較
氣泡圖 三維或四維 其中只有兩維能精確辨識
雷達圖 四維以上 數據點不超過6個

(完)

相關文章
相關標籤/搜索