劉超,網易雲計算首席架構師,有10多年的雲計算架構與開發經歷,積累了豐富的企業級應用的微服務化,容器化實戰經驗。劉超將擔任今年 5 月份 QCon 全球軟件開發大會廣州站「微服務實戰」專題的出品人,爲你們策劃幾場微服務相關的內容豐富的分享。git
近日,InfoQ 記者對劉超進行了採訪,跟你們分享了微服務實戰的挑戰和一些常見的微服務誤解,以及他對微服務發展趨勢的判斷。歡迎關注網易雲微信公衆號:Netease_Cloud,獲取更多微服務相關內容。github
一、InfoQ:劉超老師,請先介紹一下本身吧。
劉超: 我是網易雲的首席架構師,主要負責兩部分工做,對內支撐網易核心業務上雲,例如考拉,雲音樂,雲課堂,對外輸出網易的微服務經驗,幫助客戶搞定容器化與微服務化架構,已經在銀行、證券、物流、視頻監控、智能製造等多個行業落地。數據庫
二、InfoQ:網易雲在微服務方面的探索有哪些?落地過程當中有哪些難點?
劉超: 網易雲的技術團隊在博客時代就開始探索互聯網架構,是在支撐博客用戶量、訪問量就爆發式增加的過程當中,構建了聚焦微服務的網易雲輕舟微服務平臺,並支撐內部考拉、雲音樂、雲課堂等核心業務。
在實施微服務的過程當中,難點層出不窮,可謂見山開路,遇水搭橋。
實施服務化架構以後,首先實現的功能是進行統一的註冊發現和 RPC 的透明封裝,可是服務拆分多了,在 應用層面 就遇到如下問題:服務器
服務雪崩:即一個服務掛了,整個調用鏈路上的全部的服務都會受到影響;微信
大量請求堆積、故障恢復慢:即一個服務慢,卡住了,整個調用鏈路出現大量超時,要長時間等待慢的服務恢復到正常狀態;架構
在基礎設施層面,還有另外的問題:併發
服務器資源分配困難,服務器機型碎片化:服務多了,各個團隊都要申請服務器,規格不一,要求多樣,管理十分困難;框架
一臺服務器上多個進程互相影響、QoS 難以保障:採用虛擬機或者物理機的部署,每每會多個進程放在一臺服務器上,高峯期影響嚴重;運維
測試環境數量大增,環境管理、部署更新困難:每一個團隊都有反覆部署測試環境,手動部署或者腳本部署過於複雜。機器學習
爲了解決這些問題,咱們在應用層面實施瞭如下方案:
經過熔斷機制,當一個服務掛了,被影響的服務可以及時熔斷,使用 Fallback 數據保證流程在非關鍵服務不可用的狀況下,仍然能夠進行。
經過線程池和消息隊列機制實現異步化,容許服務快速失敗,當一個服務由於過慢而阻塞,被影響服務能夠在超時後快速失敗,不會影響整個調用鏈路。
在基礎設施層面,咱們實施瞭如下的方案:
統一基礎設施,擁抱容器標準,解決服務器碎片化和服務之間的隔離問題;
統一編排和彈性伸縮平臺,2015 年擁抱 Kubernetes 標準,解決了部署困難,環境不一致的問題;
打造 CI/CD 服務,抽象出產品、環境等多級概念,實現從代碼到測試到上線的自動部署。
隨着咱們支撐的內部業務愈來愈多,又遇到了如下問題:
微服務框架選型不一,技術沒法積累,面向業務定製化嚴重,上手成本高;
傳統依賴於應用運維的排障複雜度高,傳統監控服務沒法知足需求;
故障演練手段不一,硬編碼隨處可見;
API 版本管理混亂,無統一的監控,治理,無開發標準;
分佈式事務支持方式不一,和業務綁定嚴重。
爲了解決這些問題,咱們實施瞭如下方案:
微服務框架與開源技術棧統一,將服務治理邏輯抽離、以無侵入方式實現、支持 Spring Cloud、Dubbo 等開源技術棧;
全鏈路跟蹤服務與日誌服務依據 ID 進行聯繫,以發現故障點上下文;
在 Agent 引入故障注入服務,可統一進行故障演練;
服務經過 API 網關暴露,引入 API 管理、測試平臺,自動 Client SDK 生成;
實現 TCC 中間件、事務消息隊列等標準中間件。
三、InfoQ:你如何理解微服務?微服務在當前技術形勢下處於一個什麼樣的位置?
劉超: 微服務是一個很是複雜的問題,業內對微服務也存在一些誤解:
微服務主要的工做是服務拆分,主要考慮將服務拆分紅什麼粒度以及如何進行拆分;
微服務是一個運動式的過程,把你們關起門來封閉開發一個月,就能把架構修改好了,之後就萬事大吉了;
微服務僅僅是一個技術問題,交給開發團隊或者運維團隊去搞就能夠了。
微服務毫不僅僅是服務拆分,就像上圖所示,拆分只是實施微服務十二個要點之一,由於拆分了服務以後,會面臨上面咱們遇到的全部問題,沒有相應的工具和平臺,拆分的越細,越是一場災難。
微服務毫不是一個運動式的過程,而是應該漸進的過程,一旦實施了微服務,就處於業務系統不斷更新和迭代的狀態中,也處於不斷的拆分和組合中。因此不建議一開始就拆的特別細,不建議一勞永逸,而是隨着慢慢的拆成幾個,十幾個,幾十個,上百個的過程,將十二個要點所須要的工具、團隊、員工能力慢慢匹配到微服務狀態。
微服務毫不僅僅是個技術問題,牽扯到 IT 架構、應用架構、組織架構多個方面。微服務一定帶來開發、上線、運維的複雜度的提升,若是說單體應用複雜度爲 10,實施了微服務後的複雜度將是 100,配備了相應的工具和平臺後,能夠將複雜度下降到 50,但仍然比單體複雜的多。
因此實施微服務是有成本的,只有在業務層面遇到不微不行的痛點,例如痛到影響收入,痛到被競爭對手甩在後面,因此微服務每每是業務驅動或者高管驅動的,而實施微服務的結果又必然會影響到組織架構的變化,例如運維和開發的界限模糊——DevOps,專門中間件和架構師團隊的成立,數據中臺和業務中臺組的創建,小團隊自主決策等。
目前,大多數企業都意識到了微服務的重要性,可是各處的階段不一樣,我把微服務分紅三個階段:
微服務 1.0,僅使用註冊發現,基於 SpringCloud 或者 Dubbo 進行開發,目前意圖實施微服務的傳統企業大部分處於這個階段,或者正從單體應用,向這個階段過渡,處於 0.5 的階段;
微服務 2.0,使用了熔斷,限流,降級等服務治理策略,並配備完整微服務工具和平臺,目前大部分互聯網企業處於這個階段。傳統企業中的領頭羊,在作互聯網轉型的過程當中,正在向這個階段過渡,處於 1.5 的階段;
微服務 3.0,Service Mesh 將服務治理做爲通用組件,下沉到平臺層實現,使得應用層僅僅關注業務邏輯,平臺層能夠根據業務監控自動調度和參數調整,實現 AIOps 和智能調度。目前一線互聯網公司在進行這方面的嘗試。
四、InfoQ:你怎麼看微服務將來的發展趨勢?
劉超: 前面大概談了一下微服務 3.0,這裏詳細說一下我眼中的微服務的發展趨勢。
第一個就是 Service Mesh,他的主要做用就是將服務治理下沉到平臺層,進行統一的治理。
爲何會這樣呢?由於不管是在咱們內部,仍是在外部企業,都能看的這樣的趨勢。
最初只有物理機,虛擬機是放在雲平臺上,由運維組統一管理的。
後來由於能力複用和開發速度的須要,數據庫、中間件成爲了 PaaS 平臺用於部署通用的組件,持續發佈也成了 PaaS 平臺,用於部署客戶的業務,因此這兩部分也平臺化了。
隨着愈來愈多的業務須要進行服務治理,微服務框架,APM,也成爲了平臺的一部分。
可是微服務框架的統一,涉及多語言的問題,也涉及和應用層綁定的問題,不管是 Spring Cloud 仍是 Dubbo,都很難徹底平臺化,因此須要 Service Mesh,經過 sidecar 的方式,將控制面和數據面隔離,經過非侵入的模式進行流量攔截,實現真正的治理平臺化。
第二個就是 AIOps 和智能調度,就是經過對於海量數據中心收集的監控數據和業務數據,實現業務的自動調度和參數調整。
這個看起來很遙遠,其實否則,若是你們感興趣的話,能夠在網上搜索一下,Google 在 2011 年就公佈了本身數據中心收集的監控數據(https://github.com/google/clu...),並在 2014 年發表論文《Machine Learning Applications for Data Center Optimization》,使用 AI 技術優化數據中心的效率。
而國內一線互聯網公司也在 2018 年公佈 4000 臺服務器真實數據集,也在乾和 Google 相似的事情。
咱們觀察到,當數據中心的機器規模突破十萬臺的時候,效率的提升就變成了一件可以節省大量成本的事情,因此開始引發重視。而能作到這件事情,每每依靠的就是數據驅動的智能調度。
爲了支撐強大的調度功能,Google 開發了 Borg,Twitter 壯大了 Mesos,並經過將這些調度平臺和機器學習相結合,實現自動化的智能調度,國內一線互聯網公司也在進行着積極的嘗試。
隨着微服務化和容器化,服務的數量會十分的龐大,從而運維難度大幅度提升,原來僅僅會運維物理機和虛擬化的技術人員是不夠的,而運維 Kubernetes 和 Docker 的人會比較貴,使得人力成本大幅度提升。
不少組織從物理機時代,到虛擬化時代,到雲時代,再到容器時代,運維團隊的規模是愈來愈大的,每一個人的薪資也愈來愈高。
因此未來只運維少許節點的私有化容器平臺,從成本上來說是不划算的,當出現有公信力的公有云平臺,則使用公有云成爲節約成本的理智選擇。
例如亞馬遜、谷歌等公有云平臺就沒有問題,谷歌裏面的運維工程師至關貴,他們掌握最早進的技術是沒有任何問題的,可是他們會經過各類自動化,甚至智能化的技術,管理全球的幾百萬臺機器,這樣成本攤下來就不是很高了。若是你只是運維一個幾十個節點,最多幾百個節點的容器平臺,一樣須要招一些這麼貴的人,通常的企業確定受不了。因此未來要麼是大規模公有云平臺,要麼是土豪如電信金融行業的自建雲平臺,都會出現超大規模的場景,基於 AIOps 和智能調度節約成本,就是勢在必然的了。
五、InfoQ:QCon 廣州的「微服務實戰」專題下設置了 4 個演講,做爲出品人,你如何策劃這 4 個演講,想給參會者呈現微服務的哪些方面?劉超: 基於咱們本身的微服務實踐,和對於微服務發展階段的理解,做爲「微服務實戰」專題的出品人,我計劃全方位展現微服務在主流公司的主流技術方向的實踐和將來方向。
第一個方面就是 基於 Dubbo 的大規模微服務實踐的場景,Dubbo 是應用範圍很是廣的微服務框架,不少企業都是基於 Dubbo 作的,Dubbo 的實踐是微服務實施過程當中繞不過去的一環,這個主題可以解決不少技術人員實施海量 Dubbo 服務的時候遇到的問題。
第二個方面就是 基於 Spring Cloud 的大規模微服務實戰的場景,Spring Cloud 是近年來新興的微服務框架,不少新實施微服務的,會選擇基於 Spring Cloud,可是 Spring Cloud 雖然組件豐富,可選項多,可是也很複雜,學習曲線高,如何再海量場景下進行改進和適配,是常常遇到的問題,這個主題可以給予技術人員實施 Spring Cloud 微服務的時候以借鑑意義。
第三個方面就是 Service Mesh 在高併發場景下的實踐場景,前面說了 Service Mesh 是一個趨勢,一線互聯網公司都在嘗試,可是這個技術太新了,不少坑還在踩,這個主題可以帶給技術人員最前沿微服務技術的落地實踐,給想試試 Service Mesh 的技術人員以借鑑意義。
第四個方面就是 微服務框架各個方向的發展與將來趨勢,微服務涉及範圍廣,技術選型難,不少沒有實施微服務的技術人員面臨如此多的技術名詞,無所適從,選穩定的,會不會過期被淘汰,選先進的,會不會冒進出線上事故,選錯了技術方向,萬一開源的不維護了就麻煩大了,這個主題會講解微服務發展的技術趨勢和各個方向的優劣對比,給選型困難的技術人員以參考。
點擊這裏瞭解網易雲輕舟微服務平臺,獲取解決方案。
文章來源: 網易雲社區