文章發佈於公號【數智物語】 (ID:decision_engine),關注公號不錯過每一篇乾貨。html
來源 | CrossHands(ID:SmallWorldBigIdea)前端
做者 | AhongPluspython
01數據爲何要可視化?編程
一方面是由於數字太抽象,圖表更直觀,並且圖表能夠突出數據中的關注點(好比某個月的交易大幅度波動等);ide
另外一方面,數據面向的受衆大都不具有專業的數據知識,可視化的形式有助於下降讀懂數據的門檻;工具
簡言之,數據可視化提升了數據溝通的效率。佈局
舉個例子,假設如今年終彙報某KPI的達成狀況,數據以下表所示:post
可視化後的效果以下:學習
觀察可視化後的圖表,很容易就能發現Q3沒有達標,但年度累計是達標的。優化
02數據可視化的通常步驟(以數據彙報的場景爲例):
1. 準備原始數據,通常是通過統計的數據;
2. 明確展現的對象(給誰看 ) ,不一樣的彙報對象關注的業務角度和數據顆粒度不同;
3. 篩選數據中須要突出的點,確認數據背後要表達的主題或者結論;
4. 選擇合適的圖表類型;
5. 選擇可視化的工具;
6. 根據PPT的風格,調整圖表中的文字、線條、形狀以及對應的大小、顏色等,對圖表中的要素佈局進行調整;
03好的數據可視化所具有的特徵
展現了一個完整的故事(觀點或結論等 ) ,也能夠說「問題導向」(由於要說明一個問題,因此纔會統計出數據 ) ;
適量地展現有效信息,展現的內容並非越多越好,抓住問題的主幹信息便可;
展現信息的形式能清晰直觀地表達數據的內涵,受衆能很好地理解圖表要傳達的信息;
注:來源見圖片左下角
這裏以 Hans Rosling 在 TED 上的一個演講來講明「優秀的數據可視化」是什麼樣子的。
視頻源地址:https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen
04關於圖表的選擇
圖表的選擇主要基於兩方面:
數據的類型和結構,好比數據是數值仍是文字,是百分比仍是絕對值?數據的維度如何等;
圖表的功能,是要進行對比仍是描述時間序列,抑或是說明成分結構等;
這個網站(https://datavizcatalogue.com/ZH/)總結了常見的可視化圖表類型,不只按功能進行了分類,還對每種圖表的製做過程及適用場景進行了說明,很是推薦。好比關於時間序列的展現,能夠選擇的圖表方案以下:
另附兩張圖表選擇的 guideline 供參考。
https://associationanalytics.com/2017/06/25/choose-right-visualization/
原做者 Andrew Abela 圖源 https://vizard.co/tableau-interview-questions/
05關於可視化工具的選擇
若是是我的使用,建議選擇現成的或者學習成本相對低的工具。按是否須要編程能夠將做圖工做分爲兩類:
不用編程(幾乎):好比 Excel, Power BI, Tableau, SPSS 等。
須要編程的工具:好比 Python, R, SAS 等統計軟件,還有 Fine Report, Echarts, D3.JS, plot.ly 等可視化控件。
若是是工做中使用,則可能還要考慮其餘方面:
圖表類型的豐富度,e.g. 是否支持工做中要用到的圖表;
前端交互的友好程度,e.g.是否有控件能夠直接拖拉拽來生成圖表,界面是否支持交互操做,是否能導出不一樣格式或者分辨率的圖片,顏色風格能夠自定義等;
底層數據的支持,e.g.非結構化的文本數據,數據量很大,數據接口調用是否是方便等。
06關於數據可視化的補充
1. 基本的圖表是能夠組合使用的,好比柱形圖和折線圖組合使用:
注:筆者參考網上教程使用Excel製做的「折線柱狀圖」,還能夠進一步美化的
2. 圖表中的線條或者形狀能夠變得更有意思一點,好比作柱狀圖的時候能夠在「柱」裏填充圖案,更多參考(http://club.excelhome.net/thread-1019338-1-1.html)。
3. 可視化不要用力過猛,好比:
圖片來源:Say It with Charts Workbook, Gene Zelazny
4. 發揮創造性,加強對比性,好比:
圖片來源:Say It with Charts Workbook, Gene Zelazny
5. 不要在可視化中「耍花招」或者產生其餘誤導信息,好比調整座標軸使並不嚴重的輕微數據波動趨勢看起來很嚴重(最好不要這麼幹 )。
圖片來源:https://www.huffingtonpost.com/raviparikh/lie-with-data-visualization_b_5169715.html
07數據可視化的學習資源
網站
1. https://datavizcatalogue.com/ZH/
2. Python做圖能夠參考
https://python-graph-gallery.com/
3. Python 實現 50 種圖表的製做
https://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/
4. 若是用 R 做圖,那麼看這裏
https://www.r-graph-gallery.com/
5. https://datavizproject.com 給出各類圖表的說明以及每種圖表的實際使用案例(若是你知道圖表長啥樣但不知道名稱能夠來這裏搜 )。
教材
1. 《用圖表說話:麥肯錫商務溝通徹底工具箱 》 ,Gene Zelazny,清華大學出版社,主要內容講商務場景下選用什麼圖表,以及優化方案;
2. 《寫給你們看的設計書 》 ,Robbin Williams,人民郵電出版社
3. 《Excel圖表之道 》 ,劉萬祥,電子工業出版社,工具不重要,方法更重要;學習優秀的商業圖表(經濟學人等期刊雜誌 ) 也是可視化精進的方式之一;
4. 《數據之美:一本書學會可視化設計 》 ,Nathan Yau,中國人民大學出版社;
5. 《鮮活的數據:數據可視化指南 》 ,Nathan Yau,人民郵電出版社;
6. 《Storytelling with Data:A Data Visualization Guide for Business Professionals 》 ,Cole Nussbaumer Knaflic(中譯本爲:《用數據講故事 》 ) 。
附
若是你要檢索數據可視化指南相關的信息,可使用關鍵詞
data visualization, charts, graph
cheetsheet, guide, guideline, chooser, collection, cookbook, gallery
數智優質活動推介
由上海市經濟和信息化委員會、上海市商務委員會、上海市長寧區人民政府指導,上海市長寧區青年聯合會、億歐公司聯合主辦的「 2019全球新經濟年會-產業互聯網峯會」將在上海長寧舉辦。
本次大會邀請了慧聰集團、甲骨文、盛景網聯、千方科技、找鋼網、金山雲等產業巨頭 ,明勢資本、遠望資本、阿爾法公社、賽意產業基金等產業互聯網一線投資人。產業互聯網從業與創業者將共同參會交流產業互聯網的將來,共話產業變革新機遇。
大會截止日期6月13日,感興趣的小夥伴可「掃描下方海報二維碼 」 或點擊「閱讀原文 」 進行活動報名和查看大會議程安排。
活動頁面連接:https://www.iyiou.com/a/cyhlw_shanghai_2019/
掃描海報二維碼 或 點擊閱讀原文
進行「活動報名」以及「查看大會議程安排」
|| 推薦閱讀 ||
https://mp.weixin.qq.com/s/tL0hNaSwp990iF6-e2UgkA
https://mp.weixin.qq.com/s/Bj9VK6kNGUTolw-FaA_YOw
星標我,天天多一點智慧