80後阿里P10，「關老闆」如何帶着MaxCompute一路升級？

時間 2019-11-10

標籤阿里 p10 老闆如何帶着 maxcompute 一路升級欄目阿里巴巴简体版

原文原文鏈接

我是個幸運的人。雖然幸運不能被複制，可是眼光和努力能夠。
程序員

關濤/關老闆，80後的阿里P10，阿里巴巴通用計算平臺負責人，阿里巴巴計算平臺研究員。12年職場人生，微軟和阿里的選擇。面試

關濤的花名取自諧音：觀濤。有種看海觀濤的閒適，但在MaxCompute技術團隊裏，由於團隊既要作核心技術也要「落地拿結果」承擔阿里雲的客戶規模和營收，像一個小的創業公司，所以你們更喜歡叫他」關老闆」，一會兒就世俗親近了起來。數據庫

關老闆是個北方人，大高個也帶着些書生氣。由於工做的關係，帶領着一支跨國團隊，兩岸四地奔波（太平洋兩岸，北京、杭州、西雅圖、加州），說話間偶爾喜歡中英文match一下。編程

「我是一個興趣驅動型的人，職業生涯總的來講，還算挺幸運的，作本身感興趣的事情，走上IT這一行……」服務器

若是有認識關濤的人，應該會忍不住說上一句：這傢伙，運勢太好了吧。網絡

一路保送，沒考過什麼試，大學選擇計算機的緣由也很任性，喜歡玩遊戲。研究生畢業後就進入了微軟，是微軟最年輕的技術管理者之一，後來去了阿里雲，不到3年時間，已是P10，阿里巴巴通用計算平臺MaxCompute團隊負責人。架構

「特別久之前，大概初中的時候有了本身的第一臺電腦，大名鼎鼎的486，帶一個數學協處理器，主頻266MHz，內存有4MB。」框架

喜歡玩遊戲的都知道，每每會遇見有些關卡比較難，闖不過去的狀況。當時的關濤就想着：怎麼可以繞開系統這些設置？因而查了不少雜誌也看了不少書，試圖去改遊戲存檔，那個階段他第一次知道什麼是十六進制，也是最初接觸編程。機器學習

最後本身折騰着，操縱遊戲角色大殺四方，簡直無敵。讓程序按照本身的意願運行的感受，「嘿，還好玩的。」分佈式

因而，開始以爲這個專業（計算機）不錯。到了高中畢業的時候，由於數學競賽被保送到南開大學，當時的一個選擇是能夠進數學系，南開的王牌專業，但最後，關濤仍是由於興趣選擇了計算機。

人生的分叉口有不少，有時候作了第1個選擇，後面的路都會開始相通，看似順勢而爲，其實都是選擇的結果。

**從200千米的北京到8000多千米的西雅圖
工做須要按期make a little change**

2006年，關濤畢業了。這意味他要開始本身的職業生涯了，他有些躍躍欲試。

研究生的3年，由於導師有額外要求：不能去實習，這讓關濤對於招聘市場並不那麼瞭解，對於微軟一樣是「沒有太多的認知」。但北京有個MSRA，微軟亞洲研究院，聽說是當時最好的R&DCenter。

抱着試試看的心態，經歷了一成天的面試後，關濤順利地拿到了offer。他回憶：「好像也不是那麼難」。

在離家鄉河北承德200千米遠的北京，關濤一呆就是6年，是微軟Bing搜索北京團隊最初的幾十我的之一。從偏存儲層到計算層，在項目裏不斷地去充實本身。他是個興趣驅動的人，但在工做中願意變成完美主義者。

在微軟的第一個項目，是作一個分佈式KV+ObjectStore系統，用於支持Bing搜索的圖片和視頻存儲。2006年，尚未Hbase這樣的開源系統，當時6我的的小團隊徹底手寫一套分佈式KV，最終部署在3000臺機器並支持正常線上流量，在實戰中接觸到了分佈式系統中的各類挑戰，也學到了很是多的東西。「這個項目，是個好的機會與開始」。

第二個項目是作搜索後臺的IndexGen Pipeline：一個定製化的存儲與計算系統，用於支持通用搜索100B級別的超大規模數據存儲和處理，後來這個搜索後臺也成爲了微軟Bing搜索後臺的第二代架構，並服務至今。

再後來就是牽頭來作大數據上交互式查詢（JetScopeOn Cosmos），最後基本微軟一半以上的團隊都在用這個系統。

在關濤看來，無論是生活仍是職業發展，按期去make a little change是很好的選擇，保持新鮮感的同時，能看到學到更多的東西。從被別人帶着寫代碼、到本身獨立負責一些板塊，再到本身帶項目小組、帶大一點的技術團隊，這些都須要有一個自我時間界定，把握本身的發展節奏。

6年微軟後，他也準備make a bigger change：申請去了美國西雅圖的微軟總部。

8000多千米之外的城市，冬天不太冷，夏天不太熱，還有他最愛的單板滑雪，以致於一直堅持在每一年的最後一天自駕去不一樣的滑雪地。

在美國期間，關濤繼續深刻作交互式查詢、StructuredData優化推進等，也積累了不少跨國技術團隊管理的經驗。「美國有近40年的歷史，團隊成員比北京的團隊更資深一些，在美國可以看到不同的人，看到不同的項目。」

而在微軟的10年時間裏，關濤也關注到了國內以BAT爲表明的本土企業，他們發展的很好，並且有更高的加速度……

**西雅圖分部第22號員工
10年後的迴歸，面對更多的挑戰**

「當時海外辦公室剛建起來，我是阿里西雅圖分部的第22號員工。」

「在微軟10年，國內是什麼狀況？」好奇心不斷膨脹，因而在一次偶然的機會，關濤跳去了阿里，成爲了阿里巴巴通用計算平臺MaxCompute團隊裏的一員。這是2016年1月。

MaxCompute的前身是ODPS，阿里內部統一的大數據平臺，目前99%的數據存儲以及95%的計算能力都在這個平臺上產生，若是把阿里巴巴集團的數據體系比做航母戰鬥羣，那麼MaxCompute就是中間的航空母艦。

面對這樣一個已經發展了近6年的相對成熟、體量極爲龐大的平臺，挑戰很是多。而2016年1月入職阿里，2016年年會上就接過了MaxCompute的掌舵者位置，從0到1已經作完了，如何作到從1到10？留給關濤的時間並很少。

他認爲，大型系統逐步發展，是一個不斷自我進化的過程，大數據系統也不例外。

微軟的經歷給了他一些幫助：包括一樣都是大數據引擎（規模上有較大差別），以前的技術和工程經驗都能複用。而豐富的跨國技術團隊管理經驗也讓關濤更加適應阿里的工做。

**從MaxCompute1.0到MaxCompute2.0
「咱們是在飛行的飛機上換引擎」**

關濤回憶：「當時進來的時候，MaxCompute1.0 實際上是在一個技術的成熟期上，承接了阿里巴巴內部和阿里雲的核心業務，而引擎升級有技術風險和問題（咱們稱爲Regression，包括功能和性能的）。爲了保證對上層透明，咱們先作了一個框架升級，支持把引擎的不一樣版本同時部署在線上，一點一點地把流量切過來，同時觀察效果。」以後再進行引擎層面的大手術。

有點像是「在飛行的飛機上換引擎」。

現在的MaxCompute2.0相較於1.0版本，規模達到近10萬臺，性能提高超過1倍以上，每一年爲阿里巴巴節省預算超過20億，同時也讓阿里的大數據引擎能夠在將來3-5年架構上有個相對好的佈局。

技術團隊如何管理

關濤的見解是：技術管理者歸根結底仍是一個管理者。

一、首先考慮的不是本身要作什麼事情而是幫助團隊作什麼事情，更多的有一種「利他」的責任感。

二、技術前瞻性，技術團隊管理者是要帶着團隊有目標地、正確地往前走，把握將來方向很是重要。

三、招聘層面，思考如何招到合適的人，如何進行人才佈局。如今是人才在哪辦公地點就在哪的階段。

從大數據角度看阿里雙十一

要支持好雙十一，先從兩個統一提及（數據統一和資源統一）。

數據具備1+1大於2的特性，不一樣的數據融合計算能產生更大的價值。而關鍵就在於如何把數據都打通。

幾年前阿里巴巴建設中臺，把內部全部的數據放在一塊兒（物理上分佈在多地的近10萬臺服務器上，但邏輯上統一，數據的分佈和調度對用戶透明），讓豐富的數據幫助產品、業務前進。

資源的統一化：把全部機器放在一個大的資源池裏（內部稱爲混布項目），資源調度系統打通，對於機器的效率優化和整個系統的容災都有很是大的幫助。

作大數據的都瞭解，數據能夠3年翻5倍，機器卻不行，不然成本過高，不現實。而利用已有的服務器進行混合部署，「這也是近一年，咱們重點投資的一個項目，也就是把不一樣BU、不一樣種類的機器部署在同一個資源池中。」

有了這兩個統一架構的前提，雙十一在洪峯來臨的時候，能夠選擇把不那麼重要的工做先停掉（在百萬級別的做業中基於優先級和依賴作調度），讓這些機器都用來支撐洪峯。洪峯事後，又把機器主力轉移到計算上，把須要的計算儘快地輸出來。

今年雙十一，大數據集羣在流量洪峯最高的幾個小時，經過彈性支持了超過1/4的交易業務流量。

不增長棋子，僅依靠挪動棋盤上的子，就完成佈局守住將軍。固然，在此以前，團隊把MaxCompute已經從1.0版本切到了2.0版本，性能的提高也是支持雙十一數據量的關鍵。

在硬件只增長不到三分之一的基礎上，處理數據相較去年翻了一番，達到單日處理600PB的規模。能夠說，MaxCompute在這一戰役中發揮得不錯，甚至比去年更爲優秀。

**將來：雲化、新硬件、非結構化計算、非關係型計算、AI是趨勢
DBA或將被淘汰？**

去年的時候，原阿里雲總裁胡曉明說：「互聯網的雲計算競爭是世界寡頭經濟的全面競爭，在我看來，就是杭州和西雅圖的競爭。誰擁抱技術，誰就擁抱將來。」場主深覺得然。

關濤認爲：目前雲計算已經從互聯網企業向傳統企業蔓延，例如杭州的城市大腦和「最多跑一次「項目，是2G（To Government）的項目。還有基於工業大腦的工業4.0項目等。

從目前的市場態度來看，企業或許能夠更加開放一些，歡迎和擁抱這種技術變化，完成自個人數字化轉型。「雲計算不會是寡頭反而會是普惠」，關濤說。

前瞻話題：大數據處理領域，將來程序員應該關注什麼東西？

一、新硬件的發展

計算層面愈來愈與新硬件的創新緊密結合，硬件會帶來平臺革命。例如芯片類的CPU（AVX、SIMD）、ARM衆核架構、GPU，FPGA，ASIC，存儲類的NVM、SSD、SRM，網絡類的智能網卡和RDMA等新硬件的發展，新硬件與軟件的配合是值得關注的發展方向。

二、非關係型計算領域（圖計算）有不少機會

大數據如今仍是在關係型的處理層面，包括流和批都是基於關係型數據的計算，事實上，如今非關係的計算愈來愈流行了，包括知識圖譜、畫像等愈來愈有價值，這些數據組織不是關係型表達，而是以點邊的形式用圖的方式表達，更符合物理抽象，好比人和貨的關係，在風控層面，知識圖譜層面，用來描述物理實體的關係更合適。

明年初，將會推出MaxCompute的圖計算系統MaxGraph，支持圖存儲、查詢、模式匹配和GraphEmbedding等機器學習運算。

三、非結構化數據將變成大數據的主流

愈來愈多的短視頻、圖片、語音類數據，並隨着IoT的發展，可能佔據80%的數據量，因爲這類數據的特性在於結構各不相同，且數據很是大可是單位價值不高（相比傳統結構化數據），如何快速高效的解析和處理非結構化數據，是計算平臺的關鍵挑戰。

去年的時候MaxCompute發佈了一個非結構化數據處理模塊，可以用戶自定義的方式處理包括視頻音頻在內的數據。

四、 Al for Everything（also for BigData）

DBA或將被淘汰？

大數據的特色是大，不只僅是包括數據的處理規模，還包括了整個的海量數據的管理和優化。傳統數據庫領域依靠DBA人力去管理的模式將再也不適用。

用Al優化數據分佈、數據管理、作計算優化和成本優化（例如自動SubQuery合併，智能索引創建等）。「讓大數據無人駕駛」，這也是將來的趨勢。

本文做者：晉恆

閱讀原文

本文來自養碼場專訪，轉發需養碼場受權。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。