摘要: 2009年,發生了兩件看似不起眼的事。 初春剛過,阿里雲在北京一棟沒有暖氣的寫字樓寫下了飛天第一行代碼。 同年11月11日,淘寶商城啓動了一個叫作雙11的促銷活動。 誰也沒想到,多年之後他們會是如今這模樣。算法
2009年,發生了兩件看似不起眼的事。數據庫
初春剛過,阿里雲在北京一棟沒有暖氣的寫字樓寫下了飛天第一行代碼。緩存
同年11月11日,淘寶商城啓動了一個叫作雙11的促銷活動。安全
誰也沒想到,多年之後他們會是如今這模樣。服務器
前傳網絡
2007年淘寶的交易額突破了400億,技術團隊卻喜憂參半:現有集中式架構已經捉襟見肘,該如何應對?架構
隨即啓動的分佈式改造得到巨大成功,淘寶全部的業務都作了模塊化。併發
儘管此次技術升級在如今看來存在諸多侷限性:更多的是爲了應對不斷增多的圖片緩存,在CDN端對海量的圖片緩存作了一些限流操做。但就是此次改形成就了歷史上第一個雙11,2009年雙11當天的流量達到了一個高峯,在舊的架構體系下,這幾乎是一項不可能完成的任務。負載均衡
一年後,飛天的第一個版本上線,僅有幾十臺機器的集羣開始服務第一個內部客戶——阿里金融。運維
這些探索讓全部人看到了一個趨勢:用分佈式的方法將傳統、昂貴的小型機硬件和軟件,替換成通用的X86的服務器集羣,虛擬化等技術可讓計算可以按量、隨時被啓動。
流量狂奔:脈衝計算
從計算機誕生到90年代,計算資源都是做爲「可計劃性」的資源來使用。不管是探索月球,仍是研究基因的奧祕,計算資源自己是可規劃的。然而,互聯網時代的到來,一個爆發性事件,就有可能挑戰整個計算資源,不肯定性如影隨形。
毫無疑問,雙11就是這樣一個典型場景。
2011雙11的流量洪峯給技術團隊留下了午夜驚魂般難忘的回憶:系統性技術問題,使大量商家可能出現超賣。
過後,這羣國內互聯網行業最優秀的技術人開始意識到這已經不只僅是一場商業促銷活動,更是一次技術大考。
次年,天貓與阿里雲、萬網宣佈聯合推出聚石塔平臺,率先以雲計算爲「塔基」,爲天貓、淘寶平臺上的電商及電商服務商提供IT基礎設施。
基於阿里雲的ECS雲服務器、RDS雲數據庫、SLB負載均衡網絡,商家訂單源源不斷的推送到商家平臺上,保障了數據的穩定和延續。這是雲計算首次參與雙11,而且實現了191億的交易總額。
飛天的高速成長也給了全部人信心:5年的時間,飛天平臺集羣規模從1500臺到3000臺,2013年8月,單集羣超越5000臺,同時支持多集羣跨機房計算……
接下來幾年,雲計算逐漸成爲這場狂歡節中的基石,到2014年,聚石塔上96%的交易使用了阿里雲。
2015年開始,雙11構建了全球最大的混合雲,將公共雲和專有云無縫鏈接。
而這些成果最終成爲了全社會的能力:不管是春節在12306搶票,仍是在世界盃期間的狂歡,抑或是微博上的明星八卦,脈衝計算的能力在今天已經變成了常態。
數據平臺,計算創造價值
2013年先後,「船票論」在互聯網圈極爲流行。「船票」成爲了人們對於一家公司有沒有將來的判斷依據。至於如何拿到這張船票,彼時都很是模糊。
然而,移動端帶來的海量數據倒是真實存在的,移動端帶來的新需求,也推進了阿里雲大數據平臺的發展。
不爲人知的是,2004年,爲了從大數據中分析當前情況,並預測將來的趨勢,阿里就擁有了第一個大數據倉庫,到2008年,淘寶的業務量與數據量已達到2004年的數千倍,爲了讓數據成爲生產資料,從底層重構大數據技術就顯得尤其重要。
2010年春,大數據引擎MaxCompute的前身SQL Engine初版上線,運行在當時30臺機器的飛天集羣上。
2011年,飛天團隊開始探索支撐集團內部數倉業務,在1500臺機器上並行運行雲梯2的生產做業,並取得了不輸於Hadoop的性能和穩定性成績。
飛天5K項目以後,MaxCompute隨之進入5000臺機器和跨機房調度時代,而且能夠在377秒完成100TB的排序。
經過MaxCompute引擎助力,從2014年雙11開始,千人千面成爲常態。如今,這一產品已經成爲阿里巴巴的主力計算平臺:
l阿里巴巴集團99%的數據存儲以及95%的計算能力使用MaxCompute;
l天天有超過500萬個做業在平臺上運行;
l2017年雙11,MaxCompute單日數據處理超過320PB。
幾年過去,「船票論」煙消雲散,然而大數據平臺帶來的價值已顯山露水,經過大數據與人工智能算法的結合,MaxCompute已成爲ET大腦最重要的組成部分,ET城市大腦自動指揮城市路口信號燈,而且成功應用於馬來西亞的交通治理;ET工業大腦推進工廠取得更好的良品率,致力於幫助製造企業提高1%的良品率。
從數字化阿里到數字化城市,MaxCompute能夠承載EB級的數據存儲能力,成爲全球首個100TB規模Bigbench測試經過的大數據計算平臺;在公共雲上覆蓋國內外的十幾個國家和地區,專有云上部署超過100+套。
史上最大規模的人機協同
2017年的雙11被認爲是人類歷史上最大規模的人機協同「超級工程」:技術運維、商品推薦、客服、支付、物流等各個環節都引入機器智能。
數據、計算力、算法是人工智能的三大核心要素。飛天在通用計算服務的基礎上,開始探索麪向人工智能的異構計算。
2017年9月12日,阿里雲宣佈推出全新一代異構計算加速平臺,在行業內第一次覆蓋了包括AMD、NVIDIA的GPU和Intel、XILINX的FPGA在內的全部6款主流異構實例,提供最高可達75TFLOPS的算力。
全新的基礎設施讓全球最大規模的人機協同成爲了可能。雙11大量AI和視頻轉碼業務部署在ECS的GPU集羣之上,包括視頻雲的視頻智能處理、阿里小蜜、拍立淘和新零售的智能供應鏈管理等AI業務都經過阿里雲異構計算GPU昊天平臺進行加速。
l ● 阿里巴巴數據中心機器人「天巡」天天在機房巡邏,能接替運維人員以往30%的重複性工做。
l ● AI調度官「達靈」將數據中心資源分配率拉昇到90%以上。
l ● 人工智能助手‘阿里小蜜’在雙11當天承擔95%的客服諮詢。
l ● 菜鳥智慧貨倉機器人單日可發貨超過100萬件。
l ● AI設計師「鹿班」,在雙11期間設計了4.1億張商品海報。
l ● 阿里機器智能推薦系統雙11當天爲用戶生成超過567億個專屬「貨架」,像智能導購員同樣,給消費者「億人億面」的個性化推薦。
半年後的武漢雲棲大會上,阿里雲首次和合做夥伴一塊兒展出了AI智能點單設備,在沒有任喚醒詞的狀況下,客戶以每秒5個字的速度,向一臺機器點單,並頻繁更換語句,這臺機器對每次對話均做出了精準應答。
如今,這些基礎設施以及商業化的產物正服務於各行各業。
飛天2.0支撐2018全社會的雙11
若是說最初的技術變革是爲了解決平臺的流量峯值問題,那麼如今新的篇章已經開啓,新技術正在引領商業變革。
今年雙11期間,阿里雲上新增調用的彈性計算能力累計超過1000萬核,至關於10座大型數據中心,創造了「脈衝計算」的新紀錄。不只如此,飛天2.0的新能力全面支撐雙11:
● 阿里雲自研神龍彈性裸金屬服務器在覈心繫統中發揮巨大做用。其基於徹底自研的新一代軟硬融合的X-Dragon虛擬化架構,兼具物理機和虛擬機優點,解決了高峯值流量下的性能瓶頸。
● 業界首個百萬級IOPS的ESSD雲盤提供了數十PB的存儲規模,應對了史上最大的高併發IO挑戰。
● 貓晚網絡直播創下帶寬峯值記錄,阿里雲視頻雲高可靠直播方案完美保障了優酷2500萬用戶的體驗。
● CDN爲中國1/3以上的互聯網流量提供加速,視頻雲在海外爲Lazada提供直播服務。
● 國內首次大規模IPv6商業應用實踐,雲、網、端以及應用全面支持IPv6。
● 實時計算Blink處理峯值達到每秒17.18億條,至關於120萬本新華字典的數據量。
● MaxCompute支撐在線流量洪峯12萬筆/秒交易,承載45%導購流量。
● 雲盾爲雲上客戶提供上千萬次風險識別服務,並將DDoS高防技術輸出到全球,保障全球業務。
……
在這些技術底座之上,整個系統應對流量洪峯更加從容,當天交易額達到創紀錄的2135億。
固然,IoT的登場則爲雙11創造了更大的想象空間。
在消費側,IoT技術服務新零售的同時,正在催生新的追蹤經濟。消費者能夠查看進口商品完整的商品溯源實時信息,確保天貓進口商品安全可溯,遠洋運輸也實時可見。
在製造側,助力天貓品牌服裝廠商數字化接單、下單和備貨,個性化生產、柔性化製造,交期準確率近乎100%;對農業生產、運輸、銷售進行全鏈路升級。
從線上到線下,從生產製造到物流配送,從國內到海外,阿里雲的技術能力延伸到各行各業。而這只是這些新技術應用的冰山一角,雲與AI、IoT的有機融合將來還會產生什麼化學反應?咱們拭目以待。
結語
從27個品牌參加成交額不過數千萬元開始,到如今的千億級體量,雙11已經成爲一個將來商業實踐的範本,也是新技術的最大試驗場,這些新技術逐漸變成全社會的基礎能力,撬動一場全球的社會大協做。