簡介:佔超羣,花名離哲,阿里巴巴集團研究員,數據庫OLAP產品部負責人。離哲說,這個花名的由來,是武俠小說裏的一我的物。他不是天分過人那種角色,卻憑藉本身的堅持和努力,最終達到了頂峯。在雲技術這個戰場上,數據庫是核心技術廝殺最激烈的新戰場。在阿里,離哲始終堅持長期主義的技術態度,最終帶領研發團隊,研發的產品雲原生數據倉庫AnalyticDB和雲原生數據湖分析Dala Lake Analytics獲得普遍應用,得到浙江省科技進步一等獎,技術上也完成了對TPC榜單的逆襲。
2011年加入阿里巴巴,在近10年時間一直從事數據倉庫、數據湖基礎平臺研究、研發、產品化相關工做。目前在阿里雲數據庫事業部主要負責數據倉庫與數據湖相關產品的研發;達摩院數據庫與存儲實驗室研究員。數據庫
數據庫這個詞你可能有些陌生,但其實,全部的現代生活背後,都隱藏着數據庫的服務。你的每一次消費、每一次股票交易、每一條微博動態,都離不開數據庫。安全
人類的發展跟數據息息相關,人類最先的時候,是從結繩記事開始;到後來,能夠把文字記錄到甲骨文上;再到後來咱們開始有了計算機。從人類誕生開始,人類就在不停地記錄信息,其實那就是數據庫的雛形。架構
1960年阿波羅登月計劃,美國航空航天局NASA爲了記錄整個航天過程當中的全部信息,聯合 IBM 研發出了第一代數據庫——IMS。隨後數據庫技術開始進入民用領域並獲得普遍應用。分佈式
Q:您當時爲何選擇加入阿里?性能
佔超羣:應該是在11年左右,那時候認識不少淘寶的朋友,當時整個淘寶其實也發展很快。我記得印象中好像在2011年的時候,淘寶的日獨立UV超過1.2個億,而後那時候我以爲可能淘寶是最有機會去實現一個很重要的技術突破的地方。優化
Q:在阿里工做近十年,您有遇到什麼困境嗎?阿里雲
佔超羣:印象中比較深入的困境是在剛來的第五個月的時候,原本主管要求我是兩個月要上線的。可是我作了五個月還沒上線。那時候產生了第一次理念的衝突。雲計算
其實主管給我要求作一個爲單個業務服務的數據處理技術,還不能稱之爲數據庫系統,他說你把這事情作好就夠了。我當時跟主管講,這個事情不是爲單個業務服務的一個模塊,而應該是一個平臺型的設計和平臺型的系統。咱們倆一塊兒聊了好久,最終我以爲仍是很幸運的,你們仍是達成了一致,主管以爲這個事情有價值。spa
因此我當時第一天就按照一個數據庫的形態去倒推今天該怎麼作,考慮到描述語言(SQL)、優化器、存儲引擎、執行引擎,從最開始支持一個到兩個到20個業務,到今天的500多個,集團的分析業務基本都覆蓋了。設計
Q:2019年,阿里巴巴的AnalyticDB數據庫榮登TPC-DS榜單第一,終於打破了甲骨文和微軟在數據庫領域的霸主地位。您當時怎麼想到要去衝擊TPC榜單?
佔超羣:18年的10月份,我記得是在一個晚上,我拉了團隊幾個核心的骨幹,我說咱們要去衝擊一下 TPC,打磨下咱們端到端的技術,按照國際標準進行極致與嚴格苛刻的端到端驗證。
當時他們都比較反對,他們看了報告以爲好多東西都看不大懂,甚至第一反應不是很理解背後考察什麼?要用什麼技術去解決?這個裏面其實挑戰是很大的,但我說這個事情咱們必須去,我說這是咱們很重要的一個飛躍點和技術驗證點,這些技術通用化是能夠很好地打磨產品,也會對客戶產生很大的價值。
Q:不少人可能會以爲去挑戰一個長期被國外巨頭壟斷的數據庫技術榜單,您是給本身定了一個太高的目標,您中途是否有想過放棄?
佔超羣:我是很堅決的。但過程真的很是痛苦。我花了大部分時間和你們在項目室或開電話會,一項一項地摳細節,一項一項去作架構的review。
Q:徒步之旅和衝擊 TPC 有什麼殊途同歸之處?
佔超羣:我之前走過一次徒步,就是去過玄奘之路,讓我一輩子的印象深入的事情就是徒步第三天,終點是個風車鎮,從露營的地方你就能看到那個終點,可是你就怎麼走都走不過去。出發的時候還很開心以爲一會兒就能看到終點應該很快就能完成,可是走到中午發現,他們說你才走了一半不到,因此那天不少人都放棄了,就走到一半就放棄了;我走到一半的時候,我也感受特別難受。
我在中途休息了好久,內心也很想放棄。由於我這麼多年的一個性格,就是再難,只要定了,我是爬過去也好,仍是走過去也好,可是必定要去到終點。因此中途休息了特別長時間,後來仍是爬起來接着走,印象中走到天黑才走到終點。
咱們走向國際化就這種感受,你知道對手是誰,他作成咋樣了,可是你就是不知道該怎麼走過去。就是你跑一段發現,這段對手已經五年前走過了。再跑一段,發現對手七年前走過了,就這種感受,是其實很讓人又興奮又絕望的那種。
最終是在2019年的4月份,咱們就正式完成了,而且效果還很是好,拿到了性能和性價比全球第一。
Q:每一次的產業革命都伴隨着基礎設施的更迭,而在數據庫領域,也正發生着這樣一場從舊到新、從傳統到雲端的技術鉅變。您是怎樣看待這樣的轉變?
佔超羣:雲計算其實在重構整個數據庫的體系結構。之前數據庫的結構是什麼樣子呢?磁盤、CPU、內存都是單機的,要麼 Scale up 擴展單機資源如內存等,要麼 Scale out 擴展物理機數量。但今天雲計算基礎設施變化會出現什麼呢?存儲是能夠共享和按需付費的,計算也能夠按照實時的請求彈性擴展。它把整個體系結構都變了,雲原生加分佈式技術對於數據庫來講是巨大的機遇,這個東西實際上是咱們在當前,最有機會能超過國外廠商的一個新賽道。
Q:您總共招聘過多少人?
佔超羣:我看系統應該超過1500人。不管是俠客行、百年阿里,上了不少場課。
Q:您選人的標準是什麼?
佔超羣:實際上就是不少人分不清什麼叫知識,什麼叫經驗,什麼叫能力,什麼叫潛力。好比我看了一本書或一篇Paper,這隻能叫一個知識;而後我作了某件事情,用到這些知識,這叫經驗。能力是什麼呢?就是說,我作了這件事情總結出來的技術和經驗,我在B、C、D、E項目中複製了,這個就叫能力。基於這些能力,而後在面臨一個未知的時候,我也能作得很好,這叫潛力。這是咱們要去深刻挖掘出來的東西,由於咱們面臨不少未知挑戰,須要更多人一塊兒去解決。
Q:您有什麼特別的解壓方式嗎?
佔超羣:待的時間越長,慢慢會造成一個思惟慣性和執行慣性,也會失去剛入職的那種銳氣和勇氣,這是我最怕的一件事情。之前在西溪園區的時候,那個時候好比我在面臨一些壓力或者有很大挑戰和選擇的時候,我都會看一下九號館的雕像,更多時候想一想我是否是背了太多包袱了。
其實我跟你們同樣,也是從一個基層的同窗成長起來的,過程當中必定會碰到不少的委屈,包括老闆不必定理解,包括被業務方否認和批評,包括各類內外部的技術 PK,這個過程當中也是經歷了不少心裏的糾結彷徨。
不少時候我也想過放棄。但這個過程當中,好比咱們的技術用到城市大腦讓這個城市更安全,讓城市的治理效率更高;技術用到郵政等讓整個郵政的物流效率更高等。其實背後都是有很是大的技術突破和創新,這些技術在一步步地改變民生,在支持企業數字化,承載不少客戶對咱們的信任與託付,讓不少美好的事情發生。這些是能讓我在不少時候,在委屈和彷徨的時候堅持下去最大的動力。
本文內容由阿里雲實名註冊用戶自發貢獻,版權歸原做者全部,阿里雲開發者社區不擁有其著做權,亦不承擔相應法律責任。具體規則請查看《阿里雲開發者社區用戶服務協議》和《阿里雲開發者社區知識產權保護指引》。若是您發現本社區中有涉嫌抄襲的內容,填寫侵權投訴表單進行舉報,一經查實,本社區將馬上刪除涉嫌侵權內容。