數據可視化之旅(一):數據可視化過程

做者 | Destiny
來源 | 木東居士

0x00 前言

前面寫過一篇文章,叫作《數據可視化的基本流程》,是站在可視化過程當中的上下游關係,來梳理和介紹數據可視化的全過程,及其各個環節的主要工做內容。今天這篇文章,也是介紹數據可視化的過程,可是更多的是站在產品經理的視角,去呈現一個數據需求,從需求提煉、分析,到最終可視化呈現的一個過程。sql

可視化的終極目標是洞悉蘊含在數據中的現象和規律,從而幫助用戶高效而準確的進行決策。

0x01 可視化過程

一個完整的數據可視化過程,主要包括如下4個步驟:佈局

  • 肯定數據可視化的主題;
  • 提煉可視化主題的數據;
  • 根據數據關係肯定圖表;
  • 進行可視化佈局及設計;

0x02 肯定數據主題

可視化過程的第一步:肯定數據主題,即肯定須要可視化的數據是圍繞什麼主題或者目的來組織的。spa

在可視化過程當中的4個步驟之中,第一步是相對來講較容易的一步。設計

業務運營中的具體場景和遇到的實際問題,公司層面的某個戰略意圖,都是肯定數據可視化主題的來源和依據。簡而言之,一個具體問題或某項業務、戰略目標的提出,其實就能夠對應一個數據可視化的主題。3d

好比,銀行分析不一樣城市用戶的儲蓄率、儲蓄金額,電商平臺進行雙十一的實時交易狀況的大屏直播,物流公司分析包裹的流向、承運量和運輸時效,向政府機構或投資人展現公司的經營現狀等,均可以肯定相應的數據主題。blog

0x03 提煉數據

肯定數據圍繞什麼主題進行組織以後,咱們接下來要了解咱們擁有哪些數據,如何來組織數據,這裏面又衍生出另外三個問題。排序

1. 肯定數據指標

分析和評估一項業務的經營現狀一般有不一樣的角度,這也就意味着會存在不一樣的衡量指標。一樣一個業務問題或數據,由於思考視角和組織方式的不一樣,會得出大相徑庭的數據分析結果。rem

例如,要評估寄件這項業務,有人想了解寄件量,有人想知道不一樣快遞公司的運輸時效,有人想知道寄件用戶的下單渠道,還有人想了解寄件收入。get

拿起數據,就開始畫圖,會讓整個數據可視化做品沒有重點、雜亂無章,是一種用戰術上的勤勞掩蓋戰略上的懶惰,最終的呈現效果通常不理想。直播

2. 明確數據間的相互關係

基於不一樣的分析目的,所關注的數據之間的相互關係也大相徑庭,這一步實質上是在進行數據指標的維度選擇。

例如,都要統計寄件量,有人但願知道各個快遞公司的寄件量是多少,有人想了解一天內的寄件量高峯位於哪一個時段,還有人想知道寄件量TOP10的城市排名。這裏的快遞公司、時段、城市,都是觀察寄件量這個指標的不一樣維度。

一般,數據之間的相互關係包含以下幾類:

  • 趨勢型:
    一般研究的是某一變量隨另外一變量的變化趨勢,常見的有時間序列數據的可視化。
  • 對比型:
    對比兩組或者兩組以上的數據,一般用於分類數據的對比。
  • 比例型:
    數據整體和各個構成部分之間的比例關係。
  • 分佈型:
    展示一組數據的分佈狀況,如描述性統計中的集中趨勢、離散程度、偏態與峯度等。
  • 區間型:
    顯示同一維度上值的不一樣分區差別,經常使用來表示進度狀況。
  • 關聯型:
    用於直觀表示不一樣數據之間的相互關係,如包含關係、層級關係、分流關係、聯結關係等。
  • 地理型:
    經過數據在地圖上的地理位置,來展現數據在不一樣地理區域上的分佈狀況,根據空間維度不一樣,一般分爲二維地圖和三維地圖。

3. 肯定用戶關注的重點指標

肯定了要展現的數據指標和維度以後,就要對這些指標的重要性進行一個重要性排序。

由於對於一個可視化展現的終端設備而言,其屏幕大小有限,且用戶的時間有限、注意力也極其容易分散。如何讓用戶在短期內,更有效率的獲取到重要的信息,這是評估一個可視化產品好壞的重要因素。

在可視化設計以前,不妨問用戶兩個問題:

(1)若是整個版面只能展現一個最重要的信息,你但願是什麼?

(2)你但願展示這些信息的理由是什麼?經過用戶對這些問題的回答,你能瞭解到,在已肯定的指標和維度中,用戶最關注的是哪一個或哪些。

經過肯定用戶關注的重點指標,才能爲數據的可視化設計提供依據,從而經過合理的佈局和設計,將用戶的注意力集中到可視化結果中最重要的區域,提升用戶獲取重要信息的效率。

0x04 肯定圖表

數據之間的相互關係,決定了可採用的圖表類型。常見的數據關係和圖表類型的對應關係以下圖所示:

一般狀況下,同一種數據關係,對應的圖表類型是有多種方式可供選擇,是否是隨機選擇一種方式就能夠了呢?

固然不是,圖表的目的是爲了更好的去呈現數據中的現象和規律,那麼必然,可視化圖表的效果也極大的受到實際數據的影響,這個後續再分享。

0x05 可視化設計

在作好了以上的需求收集和整理以後,接下來就要開始進入可視化的設計和呈現的階段。這一步主要包括兩個方面:一是進行可視化佈局的設計,二是數據圖形化的呈現。

1. 頁面佈局

可視化設計的頁面佈局,要遵循如下三個原則:

(1)聚焦

設計者應該經過適當的排版佈局,將用戶的注意力集中到可視化結果中最重要的區域,從而將重要的數據信息凸顯出來,抓住用戶的注意力,提高用戶信息解讀的效率。

(2)平衡

要合理的利用可視化的設計空間,在確保重要信息位於可視化空間視覺中心的狀況下,保證整個頁面的不一樣元素在空間位置上處於平衡,提高設計美感。

(3)簡潔

在可視化總體佈局中,要突出重點,避免過於複雜或影響數據呈現效果的冗餘元素。

2. 圖表製做

影響圖表呈現效果的,主要有兩個影響因素,一個是數據層面的,一個是非數據層面的。

(1)數據層面

若數據中存在極端值或過多分類項等,會極大影響可視化的效果呈現,如柱形圖中柱形條的高度、氣泡圖中氣泡的大小、餅圖中的分類項太多等。

對於數據自己形成的可視化效果不佳的狀況,咱們是否是就一籌莫展了呢?固然不是,在以往的可視化過程當中,本人雖然也踩了不少坑,可是對於如何解決這類問題也積累了一些經驗,下次專題分享。

(2)非數據層面

非數據層面,可是影響圖表呈現效果的因素,一般在設計過程當中就能夠解決。

好比圖表的背景顏色、網格線的深淺有無、外邊框等等,這類元素是輔助用戶理解圖表的次要元素,但若是不加處理所有放出,視覺上就不夠聚焦,干擾到你真正想展現的數據信息。

所以,對於此類非數據層面,可是影響圖表視覺呈現的元素,應該儘可能隱藏和弱化。

0xFF 總結

最後一句我的經驗:做爲數據可視化的設計者,你應該在可視化設計以前,全面瞭解這次數據的分佈狀況、量級,一般幾行sql就能夠搞定,這樣在進行可視化設計的時候,能夠少踩不少坑。

相關文章
相關標籤/搜索