2019 雙11,訂單創新峯值達到 54.4 萬筆/秒,單日數據處理量達到 970PB,面對世界級流量洪峯,今年的阿里巴巴交出了一份亮眼的雲原生技術成績單,並實現了100% 核心應用以雲原生的方式上雲:數據庫
這些數據背後是對一個個技術問題的反覆嘗試與實踐。這一次,咱們對雲原生技術在 雙11 的實踐細節進行深挖,篩選了其中 22 篇有表明性的文章進行從新編排,整理成書《不同的 雙11 技術:阿里巴巴經濟體雲原生實踐》旨在爲行走在雲原生之路上的開發者打開新思路、提供一些有益參考。
編程
咱們採訪了上雲總架構師畢玄,如下是他對於 雙11 核心系統 100% 上雲背後雲原生的技術思考。緩存
王堅院士曾在不少場合都和阿里的技術人員講到:阿里雲做爲一家輸出技術的公司,咱們須要作到和咱們的客戶在同一架「飛機」上,而不只僅是「造飛機」或看着「飛機」在空中飛,阿里經濟體雲化最重要的就是要作到讓咱們和客戶在同一架「飛機」上。安全
早在幾年前,阿里巴巴經濟體就開始藉助阿里雲的機器資源來支撐 雙11 零點的高峯,雲的彈性資源優點使得 雙11 的機器資源投入成本降低超過 50% 以上,但在這些機器資源上部署的倒是咱們本身的技術體系,例如容器、中間件、數據庫、緩存等,也就意味着咱們和客戶實際上是在不一樣類型的「飛機」上,並且阿里巴巴經濟體在的「飛機」是專爲阿里巴巴定製打造的,外部客戶是買不到的,這是一個典型的從 Hosting 演進到 Cloud Hosting 的階段。爲了切實作到和客戶在同一架「飛機」上,在今年 3 月份,阿里雲智能事業羣 CTO 張建鋒(花名:行癲)正式對外宣佈將來一到兩年,阿里巴巴百分之百的業務要跑在公共雲上,成爲「雲上的阿里巴巴」。服務器
阿里巴巴經濟體雲化是阿里技術發展史上繼以前的分佈式架構、異地多活後的又一輪巨大的架構升級,此次架構升級須要把咱們從 Cloud Hosting 演進到 Cloud Native,Cloud Native 做爲技術圈最火熱的名詞,不一樣的人的眼中有不一樣的定義,咱們認爲 CloudNative 帶來的是一次系統構建方式的巨大變革,Cloud Native 是指業務系統的構建從基於自有、封閉的技術體系,走向基於開放、公共的 Cloud 的技術體系。微信
在 Cloud Native 時代以前,多數公司隨着業務的發展,或多或少都會打造出自有、封閉的技術體系,這一方面形成了巨大的投入,使得公司的技術人才力量沒有徹底專一的投入在業務上,另外一方面也形成了這個行業人才流動的困難,由於知識體系的不一樣,每到一家新的公司幾乎都是全新的一套,這個必定程度上影響了業務創新的速度,儘管不少的開源產品在必定程度上有助於解決這個問題,但還不足以體系化,而在 Cloud Native 時代,咱們認爲會有兩個典型的特徵:架構
1.對於業務系統端而言,在作系統設計的技術選型上,Cloud 提供了遠比自有技術體系更爲豐富了多的選擇,這使得架構師能夠更好的根據業務的情況、階段等來進行更合理、合適的技術選型,最後表現出來的特徵會是業務系統基於 Cloud 的技術體系來搭建,而愈來愈少的自建或自研,就像 Cloud Hosting 帶來的愈來愈少的公司本身 Hosting 機器的變化同樣;框架
2.對於雲廠商而言,會提供愈來愈多開放、主流的技術棧的技術產品,從而讓客戶有更爲豐富和自主的選擇權,同時雲廠商會去作到讓這些技術產品的互通性更好,這樣客戶才能真正作到對於不一樣類型的業務選擇不一樣的技術產品和體系。less
按照這樣的思路,阿里巴巴經濟體雲化在走向 Cloud Native 的道路上,咱們的原則是:
1.業務系統再也不採用自有、封閉的技術產品,而是阿里雲上對外提供哪些技術產品,咱們就基於這些來重構、新建咱們的業務系統;
2.阿里雲上提供相應技術領域的主流技術產品,同時根據阿里業務的需求去新增、完善、改造相應的技術產品,並加強不一樣技術產品的互通性、開放性。
按照這樣的原則,隨着阿里經濟體雲化項目的進展,阿里的業務系統就必將完成從基於自有、封閉的自有體系構建,進化到和阿里雲的客戶同樣,基於阿里雲上公共的技術產品的體系來構建,從而實現和客戶在同一架「飛機」上。
在這個雙11,咱們在如下幾個方面有了一些不錯的進展:
2017 年下半年,阿里集團開始嘗試使用 Kubernetes API 來改造內部自研平臺,並開始了對應用交付鏈路的改造,以適配 Kubernetes。2018 年下半年,阿里集團和螞蟻金服共同投入 Kubernetes 技術生態的研發,力求經過 Kubernetes 替換內部自研平臺,實現了小規模的驗證,支撐了當年部分 雙11 的流量。2019 年初,阿里經濟體開始進行全面上雲改造,阿里集團經過從新設計 Kubernetes 落地方案,適配雲化環境,改造落後運維習慣,在 618 前完成了雲化機房的小規模驗證。2019 年 618 以後,阿里集團內部開始全面推進 Kubernetes 落地,在大促以前完成了所有核心應用運行在 Kubernetes 的目標,並完美支撐了 雙11 大考。
阿里巴巴超大規模 Kubernetes 落地,經受了雙11大促真實場景的考驗, 單集羣能支撐萬級別 Node、十萬級別 POD 的規模。咱們推動了三個方面改造:面向終態的改造;自愈能力改造;不可變基礎設施改造。相比原有傳統的運維鏈路,擴容效率提高了 50%,集羣節點在線率達到了 99.9% 以上。
今年 雙11,咱們經過 K8s+容器+神龍的最佳組合實現了阿里核心系統 100%以雲原生的方式上雲,完美支撐了 54.4w 峯值流量以及 2684 億的成交量。基於 0 虛擬化開銷的神龍裸金屬,經過使用行業標準的容器與調度、編排、管理技術,推進經濟體雲原生技術全面升級。容器性能提高 10%、神龍節點可調度率達到 99% 以上、容器穩定性與在線率全面提高。
阿里巴巴在 雙11 的部分電商核心應用上落地了完整的 Service Mesh 解決方案,藉助 雙11 的嚴苛業務場景完成了規模化落地前的初步技術驗證;螞蟻金服也實現了 Service Mesh 的大規模落地。Service Mesh 所帶來的變化體現於:服務治理手段從過去的框架思惟向平臺思惟轉變;技術平臺的建設從面向單一編程語言向面向多編程語言轉變。
Service Mesh 創造了一次以開發者爲中心去打造面向將來的分佈式應用開發平臺的機會,給其餘技術產品創造了從新思考在雲原生時代發展的機會,給技術基礎設施如何與業務基礎技術更好地協同提供了一次探索機會,併爲探索麪向將來的異地多活、應用永遠在線的總體技術解決方案打開了一扇大門。
期待《不同的 雙11:阿里巴巴經濟體雲原生實踐》會給你帶來新的靈感。
2.容器鏡像服務 Container Registry (ACR)
3.函數計算 2.0(事件驅動的全託管 Serverless 計算服務)
4.企業級分佈式應用服務 EDAS(應用託管 + 微服務治理)
5.[Serverless 應用引擎(阿里雲首個面向應用的 Serverless 產品)](https://www.aliyun.com/produc...)
7.鏈路追蹤(雲上華佗,成本是自建鏈路追蹤系統的1/5或更少)
10.消息隊列 for Apache RocketMQ(服務於阿里集團 13 年,覆蓋全集團全部業務)
11.消息隊列 for Apache Kafka(更專業、更可靠、更安全)
「阿里巴巴雲原生微信公衆號(ID:Alicloudnative)關注微服務、Serverless、容器、Service Mesh等技術領域、聚焦雲原生流行技術趨勢、雲原生大規模的落地實踐,作最懂雲原生開發者的技術公衆號。」