我剛接觸數據可視化是在 4 年前,那時候一位大學老師 S ,叫咱們使用 R 對數據進行統計分析(對,哥也學過一陣統計呢),其中有部分知識點是用 R 繪製箱線圖、散點圖之類的可視化結果。前端
今後對數據可視化產生了濃厚的興趣,如今系統地來學習一下數據可視化。今天分享一些關於數據可視化的基本流程。算法
作任何事情都有章可循,數據可視化也是同樣,並且可視化的基本步驟、流程和體系都是通用的, 不一樣的數據均可以按照下面的模型將數據可視化。後端
這裏給出的步驟不是教你們怎麼畫出一幅「信、達、雅」的可視化結果圖,而是傳遞一種思想,也就是可視化方法論。微信
可視化不是一個算法,而是一個流程,有點像流水線,但這些流水線之間是能夠相互做用的、雙向的。ide
咱們能夠簡單地將可視化流程分紅三個部分:前端、處理、後端,這和軟件的開發流程不是一個概念。源碼分析
文字看起來不太直觀,直接上圖:post
圖中涉及到幾個主要的部分:學習
上面的可視化流程雖然簡單,但也要注意兩點:網站
這個模型跟上面的簡化流程相似,按照數據收集、處理、映射等步驟來組織可視化,步驟更明確一些。orm
這個模型由 Card 等人提出,把流水線式的可視化流程升級爲迴路,用戶能夠操做任何一個階段。如今大多數可視化流程都是仿照這個來的,大多數系統在實現上可能會有些差別。
可視分析經過人機交互自動處理和可視化分析方法緊密結合在一塊兒。下面這個圖表示最新的可視化分析模型:
從數據到知識有兩個途徑:
在這兩個途經,用戶能夠對模型可視化,也能夠從可視化結果中構建模型。
在許多應用的場合,可視化分析操做的對象是多源異構數據。這些數據中,不少噪聲、非結構化數據、異常數據,可視化界面幫助分析人員在自動分析時,直觀地看到參數的修改或者算法的選擇,加強了模型評估的效率。
此外,容許用戶自主組合自動分析和交互可視分析的方法是可視分析學流程的基本特徵。在這個過程當中,咱們能夠經過可視化及時發現中間步驟的錯誤,或者自相矛盾的錯誤,提升了可信度。
綜上,數據可視化發展到如今,人機結合是多個時代的疊加產物。一方面,機器智能在某些方面能夠作到人類數億年都完不成的工做;另外一方面,人類的通過幾億年的進化,有些「只可意會,不可言傳」的技能,即推理分析能力。
[1] 陳爲 沈則潛 陶煜波. 數據可視化[M]. 電子工業出版社, 2013.
浙江大學-陳爲、巫英才數據可視化課程
[2] Haber, R. B. and McNabb, D. A. Visualization idioms: A conceptual model for scientific visualization systems, 1990.
[3] Card S K, Mackinlay J D, Shneiderman B. Readings in information visualization: using vision to think[M]// Readings in information visualization. Morgan Kaufmann Publishers, 1999:647-650.
歡迎你們關注微信公衆號:可視化技術( visteacher )
不只有前端和可視化,還有算法、源碼分析、書籍相送
我的網站:blog.kurryluo.com
各個分享平臺的 KurryLuo 都是在下。
用心學習,認真生活,努力工做!