做者 | Destiny
來源 | 木東居士
前面寫過一篇文章,叫作《數據可視化的基本流程》,是站在可視化過程當中的上下游關係,來梳理和介紹數據可視化的全過程,及其各個環節的主要工做內容。今天這篇文章,也是介紹數據可視化的過程,可是更多的是站在產品經理的視角,去呈現一個數據需求,從需求提煉、分析,到最終可視化呈現的一個過程。sql
可視化的終極目標是洞悉蘊含在數據中的現象和規律,從而幫助用戶高效而準確的進行決策。
一個完整的數據可視化過程,主要包括如下4個步驟:佈局
可視化過程的第一步:肯定數據主題,即肯定須要可視化的數據是圍繞什麼主題或者目的來組織的。spa
在可視化過程當中的4個步驟之中,第一步是相對來講較容易的一步。設計
業務運營中的具體場景和遇到的實際問題,公司層面的某個戰略意圖,都是肯定數據可視化主題的來源和依據。簡而言之,一個具體問題或某項業務、戰略目標的提出,其實就能夠對應一個數據可視化的主題。3d
好比,銀行分析不一樣城市用戶的儲蓄率、儲蓄金額,電商平臺進行雙十一的實時交易狀況的大屏直播,物流公司分析包裹的流向、承運量和運輸時效,向政府機構或投資人展現公司的經營現狀等,均可以肯定相應的數據主題。blog
肯定數據圍繞什麼主題進行組織以後,咱們接下來要了解咱們擁有哪些數據,如何來組織數據,這裏面又衍生出另外三個問題。排序
分析和評估一項業務的經營現狀一般有不一樣的角度,這也就意味着會存在不一樣的衡量指標。一樣一個業務問題或數據,由於思考視角和組織方式的不一樣,會得出大相徑庭的數據分析結果。rem
例如,要評估寄件這項業務,有人想了解寄件量,有人想知道不一樣快遞公司的運輸時效,有人想知道寄件用戶的下單渠道,還有人想了解寄件收入。get
拿起數據,就開始畫圖,會讓整個數據可視化做品沒有重點、雜亂無章,是一種用戰術上的勤勞掩蓋戰略上的懶惰,最終的呈現效果通常不理想。直播
基於不一樣的分析目的,所關注的數據之間的相互關係也大相徑庭,這一步實質上是在進行數據指標的維度選擇。
例如,都要統計寄件量,有人但願知道各個快遞公司的寄件量是多少,有人想了解一天內的寄件量高峯位於哪一個時段,還有人想知道寄件量TOP10的城市排名。這裏的快遞公司、時段、城市,都是觀察寄件量這個指標的不一樣維度。
一般,數據之間的相互關係包含以下幾類:
肯定了要展現的數據指標和維度以後,就要對這些指標的重要性進行一個重要性排序。
由於對於一個可視化展現的終端設備而言,其屏幕大小有限,且用戶的時間有限、注意力也極其容易分散。如何讓用戶在短期內,更有效率的獲取到重要的信息,這是評估一個可視化產品好壞的重要因素。
在可視化設計以前,不妨問用戶兩個問題:
(1)若是整個版面只能展現一個最重要的信息,你但願是什麼?
(2)你但願展示這些信息的理由是什麼?經過用戶對這些問題的回答,你能瞭解到,在已肯定的指標和維度中,用戶最關注的是哪一個或哪些。
經過肯定用戶關注的重點指標,才能爲數據的可視化設計提供依據,從而經過合理的佈局和設計,將用戶的注意力集中到可視化結果中最重要的區域,提升用戶獲取重要信息的效率。
數據之間的相互關係,決定了可採用的圖表類型。常見的數據關係和圖表類型的對應關係以下圖所示:
一般狀況下,同一種數據關係,對應的圖表類型是有多種方式可供選擇,是否是隨機選擇一種方式就能夠了呢?
固然不是,圖表的目的是爲了更好的去呈現數據中的現象和規律,那麼必然,可視化圖表的效果也極大的受到實際數據的影響,這個後續再分享。
在作好了以上的需求收集和整理以後,接下來就要開始進入可視化的設計和呈現的階段。這一步主要包括兩個方面:一是進行可視化佈局的設計,二是數據圖形化的呈現。
可視化設計的頁面佈局,要遵循如下三個原則:
(1)聚焦
設計者應該經過適當的排版佈局,將用戶的注意力集中到可視化結果中最重要的區域,從而將重要的數據信息凸顯出來,抓住用戶的注意力,提高用戶信息解讀的效率。
(2)平衡
要合理的利用可視化的設計空間,在確保重要信息位於可視化空間視覺中心的狀況下,保證整個頁面的不一樣元素在空間位置上處於平衡,提高設計美感。
(3)簡潔
在可視化總體佈局中,要突出重點,避免過於複雜或影響數據呈現效果的冗餘元素。
影響圖表呈現效果的,主要有兩個影響因素,一個是數據層面的,一個是非數據層面的。
(1)數據層面
若數據中存在極端值或過多分類項等,會極大影響可視化的效果呈現,如柱形圖中柱形條的高度、氣泡圖中氣泡的大小、餅圖中的分類項太多等。
對於數據自己形成的可視化效果不佳的狀況,咱們是否是就一籌莫展了呢?固然不是,在以往的可視化過程當中,本人雖然也踩了不少坑,可是對於如何解決這類問題也積累了一些經驗,下次專題分享。
(2)非數據層面
非數據層面,可是影響圖表呈現效果的因素,一般在設計過程當中就能夠解決。
好比圖表的背景顏色、網格線的深淺有無、外邊框等等,這類元素是輔助用戶理解圖表的次要元素,但若是不加處理所有放出,視覺上就不夠聚焦,干擾到你真正想展現的數據信息。
所以,對於此類非數據層面,可是影響圖表視覺呈現的元素,應該儘可能隱藏和弱化。
最後一句我的經驗:做爲數據可視化的設計者,你應該在可視化設計以前,全面瞭解這次數據的分佈狀況、量級,一般幾行sql就能夠搞定,這樣在進行可視化設計的時候,能夠少踩不少坑。