[譯] 在數據可視化中,咱們曾經「畫」下的那些敗筆

從敗筆中學習數據可視化前端

經濟學人,咱們會很認真的對待數據可視化。咱們每週都會經過印刷品、網站或者應用程序發佈大概 40 張圖表。對於每個圖表,咱們都儘量的讓它更精確從而最好的支撐咱們所要描述的主題。但有的的時候咱們也會犯錯。若是咱們從這些錯誤中吸收教訓,咱們在將來能夠作的更好,同時其餘人也能夠從中學到一些東西。android

經過深挖咱們的檔案,我發現了一些有學習價值的例子。我對它們進行了以下三類分組:(1)誤導性,(2)混淆性和(3)沒能說明問題的圖表。對於每個錯誤分類,我都提供了一個佔用空間相似的改進版本,空間的佔用量在印刷版發行時是一個很重要的考量因素。ios

(簡短的免責聲明:大多數「原始」圖表是在從新設計圖表以前發佈的。繪製改進的圖表以符合咱們的新規範。數據是同樣的。)git


誤導性的圖表

讓咱們從數據可視化中最糟糕的罪行開始:以誤導的方式展現數據。咱們歷來不會故意的去這麼作!可是它確實常常性的在發生。讓咱們來看如下三個來自咱們案例的實例。github

錯誤:截斷比例後端

A bit left-field

這張圖表爲了展現左翼政黨帖子在 Facebook 上的平均點贊數。圖表的目是爲了體現 Corbyn 先生的帖子和其餘人的差距。less

原始的圖表不只低估了 CorByn 先生帖子的點贊人數,而還且誇大了其餘人帖子的點贊人數。在從新設計的版本中,咱們在完整的展現 CorByn 先生的直方圖的同時其餘人的直方圖也依舊可見。(對這個博客有興趣的粉絲能夠看到這個錯誤的另外一個例子。)dom

另外一個比較奇怪的事情是顏色的選擇。爲了模仿工黨的配色方案,咱們使用了三種暗色的橘色/紅色色調來區別 Jeremy Corbyn 和其餘的國會、政黨/團體。咱們沒有解釋這個。這些顏色背後的含義對大多數讀者來說是顯而易見的,可是對於那些不熟悉英國政治的讀者來說就沒有什麼意義了。工具

下載圖表數據學習

錯誤:經過精選的尺度來強調一組關係

**A rare perfect correlation? Not really.**

上面的圖表描述的是與狗體重降低相關案例。乍一看,狗的體重和脖子的尺寸是強相關的。但這是事實嗎?應該只是在某種程度上相關。

在原始圖表中,兩個尺度都降低了 3 個單位(左邊的從 21 到 18,右邊的從 45 到 42)。按百分比計算,左邊的尺度降低了 14%,右邊的尺度下降了 7%。在從新設計的圖表中,我保留了兩個尺度,可是我調整了變化的範圍,使得結果能夠更好反映一個有比較性的比例變化。

考慮到這個娛樂性質的主題,這個錯誤就沒有那麼嚴重。畢竟,兩個版本圖表所使用的信息是一致的。可是,值得一提的是:若是兩組數據緊密相關,那麼仔細的考慮一下尺度的選擇是個不錯的主意。

下載圖表數據

錯誤:選擇了錯誤的可視化方法

**Views on Brexit almost as erratic as its negotiations**

咱們在本身的每日新聞程序 Espresso 上發佈了這個投票結果表。它使用折線圖的方式來展現人們對歐盟公投結果的態度。經過這組數據,受訪者對於公投結果的見解是很不穩定的,隨着時間的推移一直在上下浮動。

咱們沒有使用散點加一條平滑的曲線來展現趨勢,而是鏈接了每個受訪者的結果。這極可能是咱們內部的工具沒有提供繪製平滑曲線的功能所形成的。直到最近,咱們仍然沒有習慣使用提供更多複雜可視化工具的統計學軟件(好比 R)。其實,現今咱們全部人都可以繪製一個投票圖,就像上面從新設計的那樣。

怎麼去截斷尺度是這個圖表中另外一個須要注意的問題。原始圖表中數據的顯示範圍被擴展的超出了數據應有的範圍。在重設計的圖表中,我在尺度的起始點和最小數據點之間預留了一部分空間。Francis Gagnon 的博客中對此總結了一個公式:對於不從零點起始的折線圖表中,至少預留 33% 的區域。

下載圖表數據


混亂的圖表

難懂的圖表不像誤導性的圖表那麼有危害,可是也表明這個圖表是一個很糟糕的可視化工做。

錯誤:思惟太過發散

… what?

經濟學人,咱們鼓勵去製造一些具備發散性思惟的新聞。可是,有時咱們作的太過了。上表展現了美國貨物貿易逆差和工廠僱傭員工數量的關係。

這個圖表是使人髮指的難以理解。它有兩個主要問題。首先,貿易逆差的所有數據都是負值,而工廠僱傭人數所有是正值。在沒有將兩組數據歸一化到同一尺度的狀況下,將他們組合到一張表中表達是不合適的。這種直白的處理方式致使了第二個問題:兩組數據沒有共享同一個基線。貿易逆差的基線是圖表頂部左半段的紅線,而右邊尺度的基線又在圖表的底部。

其實將兩組數據組合在一張表中是沒有必要的,在咱們從新設計的圖表中,貿易逆差和工廠僱傭人數之間的關係更爲清晰,僅僅是多佔據了很小的一點額外空間。

下載圖表數據

錯誤:混亂的使用顏色

50 Shades of Blue

該圖表對比了選定國家 65 歲以上人口比例和政府養老金支持的關係,重點關注了巴西。爲了使圖表更小,圖中只標註了選中的國家而且用鐵藍色高亮了這些國家,用淡藍色高亮了 OECD 的均值。

這個可視化者(我!)忽視了這樣一個事實,顏色的變化意味着種類的變化。乍一看,這個圖表也是如此,全部的鐵藍色彷佛是屬於深藍色的不一樣分組。但這不是我想要表達的事實,他們惟一的共同點只是他們被標記了。

在從新設計的版本中,全部國家的顏色沒有變化。我改變了沒有標記國家的透明度從而凸顯那些標記了的國家。而後我對字體進行了調整,用粗體字來強調咱們關注的巴西,用斜體字來標註 OECD。

下載圖表數據


觀點模糊的圖表

最後的這一類錯誤不是特別明顯。像這樣的圖表沒有誤導性也不會使人困惑。它們只是沒有很好的證實本身存在的意義 —— 一般是由於不正確的表現或者想在很小的空間裏體現不少的信息所致使的。

錯誤:包含太多的細節

**「The more colours the better!」 — No good data visualiser, ever**

多麼的色彩斑斕!咱們在德國預算盈餘的專欄中公佈了這個圖表。它顯示了 10 個歐元區國家的預算餘額和現金帳戶餘額。圖標中使用了不少種顏色,再加上自己數值很小致使大量的數據很是難以區分,想經過這樣的圖表來傳達信息是不可能的。它幾乎就是讓你在大霧中摸索前進。並且,更重要的是,咱們之因此沒有繪製全全部歐元區國家的數據,是由於這樣的堆疊數據沒有任何意義。

咱們重溫這個案例是爲了看看有沒有其餘方式來簡化這個表格。圖表的列提到了德國、希臘、荷蘭、西班牙和剩下的幾個國家。在從新設計的版本中,咱們決定只突出這些。爲了解決僅堆疊一些國家的問題,我另外添加了一個包括全部其餘歐元區國家類目(「其餘」)。(從新設計的圖標中,現金帳戶餘額低於原始圖表是由於咱們使用了歐盟統計局的修訂數據。)

下載圖表數據

錯誤:大量的數據,狹小的空間

**I give up.**

因爲空間的限制,咱們常常性的把數據強行塞到一個很小的細條上。雖然節省了空間,可是也會有像這個圖表(來自 2017 年 3 月)同樣的後果。這個案例展現了科學刊物是由男性主導的現象。全部的數據都一樣的意義而且和主題相關。可是這麼多的數據(包含了四個研究領域以及發明人)是很難在這裏展現出來的。

在深思熟慮以後,我決定仍是不要從新設計這個圖表了。若是我保存了全部的數據,那麼圖表會很臃腫從而無法簡潔的表達主題。在這種狀況下,最好的方式是砍掉一部分數據。好比,咱們能夠展現一個測量均值,或者使用全部領域的女性出版物的平均值來代替。(若是你能夠在這個狹小的空間上作的更好!那麼請告訴我,我很樂意知道你的想法。)

下載圖表數據


數據可視化的最佳實現方法正在快速發展:那些今天有效的方法,明天不必定有效。每時每刻都有新的技術涌現出來。你有沒有犯過一些很容易被修整的錯誤?快來告訴咱們!

經濟學人數據可視化記者 Sarah Leo.

若是發現譯文存在錯誤或其餘須要改進的地方,歡迎到 掘金翻譯計劃 對譯文進行修改並 PR,也可得到相應獎勵積分。文章開頭的 本文永久連接 即爲本文在 GitHub 上的 MarkDown 連接。


掘金翻譯計劃 是一個翻譯優質互聯網技術文章的社區,文章來源爲 掘金 上的英文分享文章。內容覆蓋 AndroidiOS前端後端區塊鏈產品設計人工智能等領域,想要查看更多優質譯文請持續關注 掘金翻譯計劃官方微博知乎專欄

相關文章
相關標籤/搜索