在2015年初,咱們在Uber規劃了一個官方的數據科學團隊。這個主意的緣起是:經過可視化數據探索工具從Uber的數據中發現洞見。天天,Uber 管理上億級別的GPS位置信息。每分鐘,咱們的平臺處理上百萬的移動事件。每次咱們不用技術分析就直觀地知道這是一個咱們錯過了解咱們業務的好機會。react
自成立以來,這個數據可視化團隊就不斷髮展壯大,從我和另一個工程師兩我的發展到瞭如今的15人的全棧團隊。數據可視化技術專家囊括了從計算機圖形學到信息設計、封面創意技術以及 Web 平臺開發。咱們團隊專一於從視覺分析到地圖繪製以及從框架開發到面向公衆的數據可視化的整個過程。git
讓咱們看看都作了哪些工做:github
AB測試平臺的表格和置信區間可視化
可視化分析主要都是由抽象數據可視化組成的。這個涉及到可視化工做的數據是沒有內在的地理結構。與之相反的是科學可視化,這種可視化從物理世界(地圖、3D物理結構等等)的角度描述了數據。大多數有效的可視化分析在這種狀況下都是關於報告、儀表盤、實時分析的圖標和網絡圖。咱們的團隊在大多數商業洞見應用和商業數據探索上增強了可視化圖層。其餘地區的同事用咱們的可視化工具增強了包括咱們的AB測試平臺和內部的大規模機器學習平臺的可視化效果。segmentfault
咱們團隊強調建設像咱們建立這個應用相似的可複用組件。咱們最近開源了react-vis
,這是一個 React 和增強版的D3 可視化庫,它提供了 基於JSX的語法,專用的語言來組織圖表的座標、圖標類型以及其餘一些可視化元素。它支持開發人員以聲明的方式在他們的數據集用 React- 和 JSX-友好型的形式來塑造他們想的可視化效果。瀏覽器
在地圖繪製上咱們也在作相似的工做。安全
基於地圖的信息是咱們在Uber最大最豐富的資產。然而,一方面,天天咱們的平臺實時採集上億的GPS點。另外一方面,咱們必須在瀏覽器內實現數據密集可視化。這些都對實時地圖可視化做出了極大挑戰。微信
在給定半徑區域內拖動鼠標將能夠實時看到Uber的目的地分佈狀況
咱們爲不一樣顧客量身定製多種地圖應用。其中一類顧客是在Uber運營的400多個城市內的總經理和城市運營團隊。這個普通人須要有一個當前供求分佈的及時信息。他們也須要獲取聚合數據來理解城市的市場以便於進一步的策劃市場營銷活動。另外一類用戶是數據科學團隊,他們須要豐富的數據探索界面來操做多維數據(經過產品、時間、地理數據來向下鑽取)。咱們爲其餘團隊構建能夠分塊和切片的應用以便於從數據中得到洞見。網絡
對於這些應用,咱們的技術棧是由一些咱們以前開發而且開源的庫構成的。react-map-gl 提供一個在MapboxGL基礎上與React相似的圖層。這個MapboxGL是一個咱們在Uber普遍使用的從Mapbox引入的庫。deck.gl
提供了一個建立WebGL加強圖層的應用,它能夠放在地圖的最上層或者獨自用來建立一個抽象的數據可視層。框架
deck.gl 和 react-map-gl 提供了 WebGL 界面來建立數據密集型的地圖應用
可是全部這些技術均可以以一種創造性的方式被運用。數據可視化最重要的部分實際上是數據故事敘述和數據藝術化呈現。機器學習
用數據可視化講述Uber的故事的方法有不少種。咱們能夠圍繞諸如安全、效率、流量、政策等話題在大衆傳播網絡中展開可視化敘述。
最近,咱們開始了一個探索uberPool是如何讓城市交通變得更高效的數據可視化項目。在 Travis Kalanick 的TED演講以後,你將看到咱們製做的數據可視化顯示每一個沒有使用uberPOOL的街區流量狀況,這代表了 POOL能夠經過減小流量讓城市變得更加智能化。
左圖: SF 在沒有uberPOOL時交通擁堵的城區。右圖:POOL用一種聰明的辦法均衡了交通流量。
咱們繼續作一塊兒其餘的可視化敘述。這個工做範疇有趣的融合了數據做家和數據藝術化呈現所帶來的挑戰。數據處理和咱們咱們內部可視化探索的數據分析產品同樣充滿挑戰。可是這時候,以人爲本的美學設計和通俗易懂的解釋性是比高效的信息設計技術來得更重要的。
例如,咱們開始和設計團隊協做。爲了動態地圖能夠顯示天天每輛車的Uber行程,咱們拿到了品牌視頻。這裏的特效就是用WebGL應用爲每一幀動效都在服務端渲染進行渲染而後編譯到視頻裏造成的。這個應用關注從數據獲取(經過Hive)到視頻離線渲染輸出技術的每個環節。
一個身臨其境的 3D 動畫地圖匿名展現了一成天的Uber之旅:
對於這樣的工做咱們也開發了一套叫作luma.gl
的框架,這套框架專一於基於WebGL的可視化應用。它根據一些諸如ES六、WebGL 2.0、組件化平臺的現代技術而設計。這使得luma.gl
能夠和其餘諸如stack.gl
那樣的流行的庫一塊兒互操做。
在Uber,數據使咱們最大的財富。咱們用可視化探索數據分析工具經過數據來發現洞見,並且咱們業務矩陣的數據探索也可以讓咱們Uber全部城市的管理者作出更加有效的商業決策。
若是你對和咱們的Uber工程團隊一塊兒面對這些挑戰感興趣,你能夠查看咱們的數據可視化工程的開放職位列表,而後聯繫data-viz@uber.com。咱們期待你的加入。
原做者: NICOLAS GARCIA BELMONTE 譯者:Harryzhu
英文原文地址: https://eng.uber.com/data-viz...做爲分享主義者(sharism),本人全部互聯網發佈的圖文均聽從CC版權,轉載請保留做者信息並註明做者 Harry Zhu 的 FinanceR專欄:https://segmentfault.com/blog...,若是涉及源代碼請註明GitHub地址:https://github.com/harryprince。微信號: harryzhustudio商業使用請聯繫做者。