數據爲何要可視化?如何可視化?

 

文章發佈於公號【數智物語】 (ID:decision_engine),關注公號不錯過每一篇乾貨。html

 

 

 

來源 | CrossHands(ID:SmallWorldBigIdea)前端

做者 | AhongPluspython

 

01數據爲何要可視化?編程

 

  • 一方面是由於數字太抽象,圖表更直觀,並且圖表能夠突出數據中的關注點(好比某個月的交易大幅度波動等);ide

  • 另外一方面,數據面向的受衆大都不具有專業的數據知識,可視化的形式有助於下降讀懂數據的門檻;工具

簡言之,數據可視化提升了數據溝通的效率。佈局

舉個例子,假設如今年終彙報某KPI的達成狀況,數據以下表所示:post

 

 

可視化後的效果以下:學習

 

 

觀察可視化後的圖表,很容易就能發現Q3沒有達標,但年度累計是達標的。優化

 

02數據可視化的通常步驟(以數據彙報的場景爲例):

 

1. 準備原始數據,通常是通過統計的數據;

2. 明確展現的對象(給誰看 ,不一樣的彙報對象關注的業務角度和數據顆粒度不同;

3. 篩選數據中須要突出的點,確認數據背後要表達的主題或者結論;

4. 選擇合適的圖表類型

5. 選擇可視化的工具

6. 根據PPT的風格,調整圖表中的文字、線條、形狀以及對應的大小、顏色等,對圖表中的要素佈局進行調整;

 

03好的數據可視化所具有的特徵

 

  • 展現了一個完整的故事(觀點或結論等 也能夠說「問題導向」(由於要說明一個問題,因此纔會統計出數據

  • 適量地展現有效信息,展現的內容並非越多越好,抓住問題的主幹信息便可;

  • 展現信息的形式能清晰直觀地表達數據的內涵,受衆能很好地理解圖表要傳達的信息;

 

注:來源見圖片左下角

 

這裏以 Hans Rosling 在 TED 上的一個演講來講明「優秀的數據可視化」是什麼樣子的。

 

視頻源地址:https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen

 

04關於圖表的選擇

 

圖表的選擇主要基於兩方面:

  • 數據的類型和結構,好比數據是數值仍是文字,是百分比仍是絕對值?數據的維度如何等;

  • 圖表的功能,是要進行對比仍是描述時間序列,抑或是說明成分結構等;

 

這個網站(https://datavizcatalogue.com/ZH/)總結了常見的可視化圖表類型,不只按功能進行了分類,還對每種圖表的製做過程及適用場景進行了說明,很是推薦。好比關於時間序列的展現,能夠選擇的圖表方案以下:

 

 

另附兩張圖表選擇的 guideline 供參考。

 

https://associationanalytics.com/2017/06/25/choose-right-visualization/

 

原做者 Andrew Abela 圖源 https://vizard.co/tableau-interview-questions/

 

05關於可視化工具的選擇

 

若是是我的使用,建議選擇現成的或者學習成本相對低的工具。按是否須要編程能夠將做圖工做分爲兩類:

  • 不用編程(幾乎):好比 Excel, Power BI, Tableau, SPSS 等。

  • 須要編程的工具:好比 Python, R, SAS 等統計軟件,還有 Fine Report, Echarts, D3.JS, plot.ly 等可視化控件。

 

若是是工做中使用,則可能還要考慮其餘方面:

  • 圖表類型的豐富度,e.g. 是否支持工做中要用到的圖表;

  • 前端交互的友好程度,e.g.是否有控件能夠直接拖拉拽來生成圖表,界面是否支持交互操做,是否能導出不一樣格式或者分辨率的圖片,顏色風格能夠自定義等;

  • 底層數據的支持,e.g.非結構化的文本數據,數據量很大,數據接口調用是否是方便等。

 

06關於數據可視化的補充

 

1. 基本的圖表是能夠組合使用的,好比柱形圖和折線圖組合使用:

 

注:筆者參考網上教程使用Excel製做的「折線柱狀圖」,還能夠進一步美化的

 

2. 圖表中的線條或者形狀能夠變得更有意思一點,好比作柱狀圖的時候能夠在「柱」裏填充圖案,更多參考(http://club.excelhome.net/thread-1019338-1-1.html)。

 

3. 可視化不要用力過猛,好比:

 

圖片來源:Say It with Charts Workbook, Gene Zelazny

 

4. 發揮創造性,加強對比性,好比:

 

圖片來源:Say It with Charts Workbook, Gene Zelazny

 

5. 不要在可視化中「耍花招」或者產生其餘誤導信息,好比調整座標軸使並不嚴重的輕微數據波動趨勢看起來很嚴重(最好不要這麼幹 )。

 

圖片來源:https://www.huffingtonpost.com/raviparikh/lie-with-data-visualization_b_5169715.html

 

07數據可視化的學習資源

 

  • 網站

1. https://datavizcatalogue.com/ZH/

2. Python做圖能夠參考 

https://python-graph-gallery.com/

3. Python 實現 50 種圖表的製做 

https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/

4. 若是用 R 做圖,那麼看這裏 

https://www.r-graph-gallery.com/

5.  https://datavizproject.com 給出各類圖表的說明以及每種圖表的實際使用案例(若是你知道圖表長啥樣但不知道名稱能夠來這裏搜 )。

 

  • 教材

1. 《用圖表說話:麥肯錫商務溝通徹底工具箱 ,Gene Zelazny,清華大學出版社,主要內容講商務場景下選用什麼圖表,以及優化方案;

2. 《寫給你們看的設計書 ,Robbin Williams,人民郵電出版社

3. 《Excel圖表之道 ,劉萬祥,電子工業出版社,工具不重要,方法更重要;學習優秀的商業圖表(經濟學人等期刊雜誌 也是可視化精進的方式之一;

4. 《數據之美:一本書學會可視化設計 ,Nathan Yau,中國人民大學出版社;

5. 《鮮活的數據:數據可視化指南 ,Nathan Yau,人民郵電出版社;

6. 《Storytelling with Data:A Data Visualization Guide for Business Professionals ,Cole Nussbaumer Knaflic(中譯本爲:《用數據講故事

 

若是你要檢索數據可視化指南相關的信息,可使用關鍵詞

  • data visualization, charts, graph

  • cheetsheet, guide, guideline, chooser, collection, cookbook, gallery

 

數智優質活動推介

 

由上海市經濟和信息化委員會、上海市商務委員會、上海市長寧區人民政府指導,上海市長寧區青年聯合會、億歐公司聯合主辦的「 2019全球新經濟年會-產業互聯網峯會」將在上海長寧舉辦。

 

本次大會邀請了慧聰集團、甲骨文、盛景網聯、千方科技、找鋼網、金山雲等產業巨頭 ,明勢資本、遠望資本、阿爾法公社、賽意產業基金等產業互聯網一線投資人。產業互聯網從業與創業者將共同參會交流產業互聯網的將來,共話產業變革新機遇。

 

大會截止日期6月13日,感興趣的小夥伴可「掃描下方海報二維碼 或點擊「閱讀原文 進行活動報名和查看大會議程安排。

 

111.jpg

活動頁面連接:https://www.iyiou.com/a/cyhlw_shanghai_2019/

掃描海報二維碼 或 點擊閱讀原文

進行「活動報名」以及「查看大會議程安排

 

|| 推薦閱讀 ||

 

連接圖片1.png

https://mp.weixin.qq.com/s/tL0hNaSwp990iF6-e2UgkA

 

連接圖片3.png

https://mp.weixin.qq.com/s/Bj9VK6kNGUTolw-FaA_YOw

 

 

 

星標我,天天多一點智慧

 

相關文章
相關標籤/搜索