摘要:來自華爲雲直播的段亮詳細介紹華爲雲視頻在Cloud Native的轉型實踐中遇到的問題、挑戰以及解決之道。
隨着雲基礎設施服務以及邊緣計算技術的發展,Cloud Native,即雲原生,架構理念和研發也愈來愈普及。從傳統軟件架構,到雲原生軟件架構的轉變,還須要經歷一段時間才能逐漸走向成熟。今天華爲雲直播的段亮老師從經驗和教訓的角度,詳細介紹華爲雲視頻在Cloud Native的轉型實踐中遇到的問題、挑戰以及解決之道。前端
主題主要分爲三個部分:前兩個部分回顧關於Cloud Native自己具備哪些的特徵以及架構;第三部分是重點想分享的,即華爲雲視頻業務在探索和實踐Cloud Native的過程中具體是怎麼作的,以及遇到了哪些問題,但願本次分享可以對想要或者正在使用雲原生的小夥伴帶來幫助。編程
先來回顧一下,在2010年,Paul(Paul Fremantle)提出了雲原生的概念,起初只提出了關於彈性、分佈式、多租戶等基本特徵;隨着實踐和發展,Adrian(Adrian Cockcroft,2013)和Matt(Matt Stine,2015)相繼對關鍵特徵進行完善,逐漸提出了反脆弱性、DevOps、持續交付等更新的認識。這就是Cloud Native最初的發展。緩存
從團隊來看,CNCF提出了Cloud Native的特徵和目標,Gartner也一樣作出了重要的規範。安全
華爲公司早在201六、17年,就開始經過內部發文的方式,統一雲原生定義並規範語言,便於各部分和業務之間對齊語言,包括(微)服務化、彈性伸縮、分佈式等,同時對這些關鍵特徵的定義和範圍,也都作了很是詳細的規範。服務器
整個雲原生,咱們認爲應該分紅三大部分。基於康威定律,組織決定其所成就的業務。對實踐雲原生而言,組織的變化最能使咱們感同身受,尤爲是對每個人的能力要求發生了很是明顯的變化。例如,對研發人員再也不像之前傳統模式下的要求,即實現需求就能夠;如今,從前端需求討論,到需求分析,再到開發、參與測試、參與灰度的過程,最後到上線以及線上運行的狀況,包括監控、告警等,都須要端到端的關注。因此,對研發團隊人員技能的要求提升了。網絡
今天,重點和你們分享的是關於雲原生的架構和工程方面。各個公司根據不一樣的業務,都會涉及到這兩個方面,因此更有參考價值。架構方面的核心是微服務架構,其後還有彈性伸縮和分佈式等特徵;工程能力有DevOps、持續交付、灰度上線等。最終的目標是讓雲應用可以快速高效地部署和規模化,以及實現整個服務的高可用性。這是雲原生的總體概略,下面我將圍繞架構和工程兩個方面和你們展開分享。架構
雲原生的架構,最核心的部分是微服務的架構。微服務的首要特徵是高內聚、功能單一,最好的狀態是一個微服務只作一件事情,而且各微服務之間經過進程隔離、獨立代碼庫等,使得每一個微服務均可以單獨測試、部署和升級。這樣,單個微服務規模較小,能夠作到靈活使用且易於管理。實現微服務化後,整個雲原生的交付和小團隊溝通都能快速進行,由於微服務之間使用API(應用程序編程接口)通訊,沒有了開發語言的限制,小團隊溝通會更簡單、順暢。任何一個功能點或微服務出現問題,其故障影響範圍只存在於本服務器內部,這樣能夠提高微服務總體的高可用性,且每一個微服務都能單獨演化。運維
既然微服務如此重要,接下來就進一步對比微服務架構和傳統架構。傳統單體架構的軟件是按模塊劃分的,一個複雜的系統可能會劃分幾十個甚至更多的模塊,每一個模塊完成必定的功能,模塊之間多是內部代碼級的接口調用或本地API調用。能夠看出,在架構簡單或系統功能單一的狀況下,單體軟件在初始階段效率可能更高,由於整個系統使用一套代碼,在部署和靜態檢查時更容易管理,且內存是共享的,能夠調用,時延更低,這是它的好處。若是雲原生下的全部功能點所有經過微服務化的API調用,調用之間就會形成時延。分佈式
那麼微服務架構有什麼好處呢?進程隔離,代碼之間完全解耦,即各微服務能夠單獨演化和發展。對比傳統的單體架構,其在設計上確定想要解耦使模塊功能獨立,但在架構演進的過程當中,開發人員不免把控不力,致使耦合愈來愈不清晰,同時每一個模塊的變更都會涉及到其餘模塊的升級變動,甚至影響到技術棧發展。一個模塊的重構會對另外一個模塊產生影響,致使整個系統的演進變得異常困難。可是,在服務化架構下,以上問題都能迎刃而解。每一個服務之間經過API協做完成,更加靈活高效。隨着系統規模的擴大,效率也不會下降,可用性和開發效率等方面也能獲得保證。微服務
在充分使用雲基礎設施及平臺服務方面,咱們的架構師和設計人員的思路也發生了較大變化。雲原生軟件構建在整個雲的基礎上,雲包括計算資源、網絡資源、存儲資源、消息隊列等,優先使用雲服務上已有的資源,而這些資源經過編排的方式調用,便於實現整個系統的可用性。也就是說,每一個服務、每一個應用,僅需關注本身須要實現的部分,而不是實現每個功能。在單體架構下,較常規的狀況是:須要某一特性,就找到一個開源的代碼、軟件或模塊拿來使用,這種方式是不可取的。在雲原生下,經過調用其餘服務來實現會更聚焦和高效。
彈性伸縮也是雲原生的精髓,主要須要解決兩個問題:一是「伸」,二是「縮」。對於視頻業務而言,其規模每每是不可控制的。若主播在直播時產生一個爆點,大量用戶涌入,致使業務量陡增。這時,咱們的服務須要可以自動拓展資源,若是等到業務人員接收到高負荷提醒後,再主動升級變動擴展資源,可能會來不及。以上是彈性伸縮中「伸」的部分,而「縮」的必要性主要基於成本。咱們知道,視頻天天都會有一個高峯期,好比,教育類的視頻服務會在早上上課的時間達到高峯期,而遊戲類的直播視頻在晚上8點到10點是高峯期。高峯期相對於低峯期,其業務規模相差十倍甚至百倍以上,若資源不會自動開放,在空閒期間就會形成資源浪費。「縮」就可把資源釋放出來,提供給其餘服務使用。
分佈式是雲原生的一個核心理念,主要用於提升可用性。分佈式分爲三個部分:其一,應用分佈式,分佈在多AZ(可用區)和多Region(區域)上。若是出現一個故障,不至於影響到其餘方面。例如,一個城市的電力系統故障,或者某條光纖被挖斷了,也不至於影響到總體服務的可用性。其二,數據分佈式。各城市之間,重要的數據須要作到跨Region和跨AZ的同步部署和存儲。其三,跨可用區的部署以及總體的調度。用咱們今天的分享舉例,整個媒體處理分佈在各個不一樣的Region上,假設某個城市的光纖出了問題,也不會影響整個直播的過程和質量。這就是分佈式帶來的好處。
在雲原生下,可用性和傳統模式有着本質的區別,在設計思路上就全然不一樣,雲原生是基於不可靠、可拋棄的資源設計反脆弱性的系統。舉例說明:在沙漠上建一座牢固的大樓,應該怎麼建?咱們不能由於沙地不穩固,在其上建造出的樓也不穩定。雲原生的系統設計,並無假設系統下的資源是穩定的,實際上全部資源均可能出故障。那麼,系統的反脆弱性具體應該怎麼設計?這纔是咱們雲原生設計的精髓之一。
在傳統方式上,咱們老是在安全、可用等方面下大功夫,但願把系統中的bug和故障所有清除掉,不留任何隱患,這種思路是沒有錯的。可是,隨着雲上系統規模愈來愈大,雲服務愈來愈多,想要清除全部的bug幾乎是不可能完成的任務。在設計上,咱們應該認可失效是時常發生的。同時,須要考慮的是,如何在系統或者某個功能失效的前提下,業務還能正常運行。如,在某一微服務出現故障以後,如何快速發現並自我隔離,從而消除其對整個系統的影響;甚至,在整個可用區和核心服務出現故障時,怎樣對服務進行降級,而不是任由整個服務癱瘓。好比,系統中有10個業務,如今出現一個故障,致使3個業務不可用,那麼另外7個業務是否能繼續服務?這是在雲原生下設計系統的一個核心理念。
目前,雲原生下的微服務數量較多,大部分狀況下,若是系統規模中等,微服務數量是幾十上百甚至更多,若採用人工運維的方式幾乎是不可能的。由於每一個微服務的運行狀態都是很是複雜的,且各服務之間也會產生各類複雜的關係。若僅從最上層的客戶黃金指標來判斷系統的運行情況,那最終出現問題時,事態可能已經很嚴重了。因此從開發、部署、升級、問題定位等各方面來看,自動化運維都是雲原生下很是重要的一環。
灰度發佈也是整個雲原生核心的一部分。咱們的系統一直處於開發當中,若是沒有灰度發佈,如何變動一直在開發中的系統?打個比方,一架飛機在高空飛行,不能等飛機落地以後再更換髮動機。同理,若是我是一名客戶,想讓系統停下再去變動,也是不可能執行的。那麼,如何在變動的同時保證全部的業務可用,而且保證系統可以穩步向前發展,這其中有着很是大的挑戰。灰度發佈是目前應用較普遍的方式,其餘還有滾動發佈、藍綠髮布等方式,其中藍綠髮佈會形成資源浪費。灰度發佈是目前經常使用的一種方式,經過灰度升級,逐漸擴大灰度範圍,從而保證整個服務的可用性,中途若出現問題則快速回滾。
下面和你們分享咱們的雲視頻業務在實踐雲原生的過程當中的一些經驗和教訓。
華爲雲不但統一了雲原生的定義和語言,同時還對多個雲原生項目進行了總結,包括內部的架構設計指南,即雲原生的架構具體應該如何設計,其中還包括一些優秀案例。對於不一樣的場景和模式,咱們構建了架構模式庫,在設計過程當中,能夠直接參考模式庫,方便高效、高質地完成架構設計。對整個雲原生,咱們也進行了全面、規範的體系建設,各服務間的Console、風格,包括如何鑑權、AKI網關如何對接、接口風格等,都有統一的規範。最後一點很關鍵,針對各業務的雲原生研發成熟度,在工具中設立雲原生架構評價標準,提供數值打分。這樣,包括雲視頻在內的每個業務,均可以衡量其當前狀態與理想狀態之間的差距,而且知曉待改進的方面在哪裏。
雲原生是一系列雲上經驗的總結,在實施過程當中,沒有把全部經驗全都實踐一遍的必要,只需引用業務所需的實踐便可。重要的是經驗的價值。
咱們對微服務架構也作了總結,從服務發現、服務註冊、到服務劃分和部署等,各模式都有統一的要求。包括可用性、自動化運維等等,在這裏就不詳細展開了。
咱們對比一下左右兩張圖。左圖是業務剛剛構建之初的微服務架構,當時對雲原生的瞭解並未深刻,業務邏輯相對比較簡單。大概一年以後,咱們發現之前的業務架構出現了問題。第一,開發效率愈來愈低,因爲一個服務的開發常常會涉及到其餘服務,而且須要頻繁變動,致使一個需求須要很長時間的開發才能上線,客戶響應時間明顯變低;第二,測試愈來愈困難,架構出現腐化,代碼出現壞味道。基於多種方式判斷,咱們認爲須要重構架構。如今看向右圖,將以前的VodManager微服務拆分爲四、5個服務,每個服務的功能邏輯都是相對獨立的,一個需求的開發只會落到1、兩個服務裏,測試變得簡單,開發也更加高效。我認爲,微服務劃分是動態的,沒有一個理想的架構和劃分方法,只有一些指導的原則,這些原則就是咱們以前所講到的,這裏就不贅述了。須要根據任務場景、以及系統業務複雜度、用戶數量和具體要求等方面統一看待,有問題就進行重構,沒有問題就儘量簡單化。這是咱們在微服務架構重構方面的一些實踐。
再強調一點,這裏的微服務架構並不能一次性變動到位,而是一個逐漸演進的過程。可能本週拆分出一個微服務,下週又拆分出一個微服務;並不能提早限定時間進行拆分,而後一次性上線。我認爲緣由主要是基於質量上的考慮,若是忽然重構所有架構,可能會涉及幾十甚至更多代碼同時上線,質量是很難保證的。每次變動一個微服務,就會有一個灰度過程,從而保護客戶服務的可用性。目前,整個雲視頻業務,咱們的服務個數大概有2百個,人均一個或一個多一點的規模,都有對外API接口,接口數量約2千個。並非說越多越好,以上內容僅給你們作一個參考。
咱們認爲在雲服務上必需要作容器化,由於各微服務之間是相互獨立的,並且應該設計爲無狀態,隨時能夠被銷燬。上圖是咱們實時性視頻的一個微服務,目前已經商用了,其中一個案例能夠和你們分享一下。全部微服務所有容器化,由於任何一個實例均可以被銷燬,若是出現變動或是業務量上升,隨意拉起一個微服務,其餘微服務仍能正常工做。在這裏重述一點,進行對外服務的微服務,咱們建議首先經過域名調度,不要經過IP,由於可能會有多Region的狀況。你們都明白,若是一個Region出了問題,域名還能解析到另外一個Region上去。對於對外呈現解析的IP,首先它應該是一個EIP,且須要有主備,不能是單一的IP。由於EIP能夠對應後面多個IP地址,能夠保證任何一個IP或者主機出了問題,都不會都總體服務產生影響。這是對對外服務微服務的一個考慮。
另外,全部微服務之間都不能直接調用,都應該經過服務網格的方式調用。目前華爲雲上比較成熟的是CSE,該方式通過了大規模的考驗。比較新的方式有Istio,這兩年逐漸開始使用,服務線數量增長較快。咱們的整個雲視頻板塊Docker(容器)的數量最高峯的時候達到了好幾千個。
這裏經過咱們本身遇到的一些狀況,特別講解一下容器化的好處。最開始咱們並無採用容器化的方式,後來發現經過容器化,資源利用率明顯降低,由於彈性伸縮作的比較容易;另外一點是快速啓停,咱們如今用容器基本能夠達到秒級重啓,若是須要就能夠秒級彈出、秒級部署,並且各個服務之間的遷移、依賴關係、解耦、服務打包等各方面操做都很迅速。咱們如今代碼的升級、變動、流水線等等都是和容器化綁定的。以上是咱們關於容器化的實踐。
剛剛也提到,彈性伸縮在雲原生裏是很重要的一部分,由於它切實影響到可用性和成本。視頻中的彈性伸縮主要考慮什麼問題呢?首先,"彈",我認爲是沒有問題的,上面的配置圖隱去了數據。使用起來很簡單,根據事件驅動,如內存、網絡、業務量等,當達到某一特定值時,相應地彈出多少個實例,彈出速度很是快,基本可達到秒級彈出。因此,「彈」的方面是沒有問題的。可是,對於視頻業務而言,「縮」也很是重要。
那麼,「縮」具體會遇到什麼問題呢?視頻包括直播、會議、RTC等業務,對實時性的要求很是高。好比,在某一個實例上,有1000個用戶同時在觀看,其中有800個已經下線,只有200個佔用了一個實例,此時應該怎麼辦呢?咱們的作法有兩種,一種方式是,在新業務的調度上,基於部分指定的容器優先預調這些業務,尤爲在業務規模的降低期,根據業務的狀況,可能要留出半小時到一小時不等的時間進行收縮。對於實在很小的業務,怎樣把直播遷移到另外一個容器當中去,並且對用戶的觀看體驗沒有任何影響。這纔是彈性伸縮實踐中,雲視頻業務作到「縮」的時候很重要的一點。
左下角的圖展現的是24小時內高峯期和低峯期的資源利用率。原本,高峯期和低峯期的峯值有10倍甚至百倍之差,但CPU資源的利用率還算平穩,並未出現大起大落。這就是彈性伸縮所須要作到的一個能力。
雲服務上沒有OPS,至關於人沒有眼睛。操做每一塊業務,可視化每一項服務,出了問題以後快速定位,OPS都是核心能力。業務監控、配置、調用鏈、日誌規模分析等都能在OPS裏很好地體現。這一部分與業務相關性較強,因此只展現了雲視頻能力,包括故障的定位定界、運營、管理、配置等都是必須的。
OPS平臺依賴大量的數據,尤爲是日誌的數據,由於問題的定位定界、故障,告警等,所有分析都依賴於這些數據。在雲服務下,整個運維的架構很是重要。對於雲視頻板塊,我向你們展現一下咱們的過程,供各位借鑑。
針對數據採集上報,須要考慮本地冗餘,不能直接上報,在失敗以後就丟掉。並且考慮成本,並不會預留很大的數據通道供使用,因此本地須要有緩存能力,以及上報失敗後重覆上報的能力。對於數據接入,咱們採用Kafka對數據進行二次匯聚,由於原始數據過大,對其分析、存儲、查詢等規模上都沒法知足。目前,天天的日誌量可達數百T,並且不能長久存儲。我認爲,運維架構能夠不斷演進。咱們的運維架構起初設計出來時,比如今的要簡單不少,而上圖的架構是咱們研究至今的狀況。你們在構建日誌系統或運維繫統時,須要着重考慮如下兩點:一、日誌上報實時性。日誌如同神經表現,快速得到日誌,就能快速瞭解系統中存在的問題並解決。實時性是一個挑戰,固然這也和成本掛鉤。二、日誌實時數據。包括數據的匯聚、分析、展現。
前面提到在微服務架構下,會存在不少個擁有單獨代碼庫的微服務,其相對單體軟件而言更加獨立,但隨之而來的問題是——管理。每個微服務都須要人工部署,並且頻度很高,幾乎不可能實現。因此工程能力的工具化、自動化,且可以實現服務自治是雲原生中很是重要的一部分,須要在最初時就開始構建。從開發人員寫完代碼到上線,須要經歷哪些步驟?從第一幅圖中能夠看到,包括開發代碼、靜態檢查、合規掃描、Alpha測試、Gamma測試、自動部署、灰度發佈、在線測試等。雖然,開發一個功能可能只須要30-50行代碼,但一套流程全靠人工幾乎是不可能完成的。可是,在工具化以後,只需在本地開放代碼並測試後一鍵提交,整個過程只在部署環節須要人工確認,其餘步驟能夠所有經過工具化自動完成,從而實現一人運維多個微服務。目前,咱們的團隊每個月大約有500屢次變動,一年達數千次變動。按照業務發展,而且視頻領域更加活躍,包括RTC等業務場景,明年的變動次數必定會更多,因此服務自治很是重要。
灰度發佈也是雲服務核心的一部分,服務上線、開發過程質量的基本保障,目前主要使用灰度發佈。灰度方式可基於流量、內容、域名、特性等,與開發特性相關,在腳本里便捷地更改後就實現快速發佈。每種發佈都有驗證,驗證能夠是自動的撥測用例、人工撥測,還能與客戶共同測試。
前面所講內容,除了提高效率和下降成本以外,最核心的一點是雲服務的可用性。雲服務可用性是對客戶的服務承諾,出了問題,不只是賠款,更嚴重的是影響品牌信譽。那麼如何作到可用性?總結以下:基於承認失敗的理念設計,可以對失敗的業務進行降級;同時對於底層資源作到多AZ,這樣一個城市的機房出問題時,不會影響總體服務,多Region相互容災,最後實現總體的可用性。可是可用性只能作到儘量高,不能作到百分之百,整個過程還須要你們共同探索。上圖展現了一個比較嚴重的事件:某個Region區底層的全部資源幾乎都不可用了,圖中紅線顯示的是咱們的業務,幾乎沒有受到任何影響。在保證業務不受影響的前提下提升服務可用性,應該是咱們共同的願望。
本文分享自華爲雲社區《Cloud Native雲視頻實踐》,原文做者:音視頻大管家。