摘要: Cloud Native 應用架構隨着雲技術的發展受到業界特別重視和關注,尤爲是 CNCF(Cloud Native Computing Foundation)項目蓬勃發展之際。Dubbo 做爲服務治理的標誌性項目,天然緊跟業界的潮流,擁抱技術的變化。html
Dubbo Cloud Native 實踐與思考react
Cloud Native 應用架構隨着雲技術的發展受到業界特別重視和關注,尤爲是 CNCF(Cloud Native Computing Foundation)項目蓬勃發展之際。Dubbo 做爲服務治理的標誌性項目,天然緊跟業界的潮流,擁抱技術的變化。本次分享的議題包括介紹 Apache 孵化項目Dubbo Spring Boot Project 以及彙報 Dubbo 與 Cloud Native 整合過程當中的一些實踐與思考,如適配 Spring Cloud 、服務發現、服務網關、服務跟蹤以及監控等。git
注:爲了讀者的閱讀方便和習慣,本文字稿將在演講內容的基礎上作出適當的調整。程序員
自我介紹
馬昕曦(小馬哥),阿里巴巴中間件技術專家,十餘年 Java EE 從業經驗,Dubbo 維護者、架構師以及微服務佈道師。目前主要負責阿里巴巴集團微服務技術實施、架構衍進、基礎設施構建等。重點關注雲計算、微服務以及軟件架構等領域。經過 SUN Java(SCJP、SCWCD、SCBCD)以及 Oracle OCA 等的認證。github
主要議程
今天我很是榮幸地與你們一塊兒討論關於 Dubbo Cloud Native 相關議題,本次議題緊扣「實踐與思考「兩個關鍵字,主要的議程包括:web
Cloud Native 基礎設施
Cloud Native 架構選型
Dubbo Cloud Native 準備
Cloud Native 基礎設施
關於 Cloud Native 的定義,不一樣的雲平臺可能給出的內容存在差別。此處,我向你們介紹目前最熱門的 CNCF 的定義:算法
」CNCF Cloud Native Definition v1.0「 中的描述:spring
Cloud native technologies empower organizations to build and run scalable applications in modern, dynamic environments such as public, private, and hybrid clouds. Containers, service meshes, microservices, immutable infrastructure, and declarative APIs exemplify this approach.數據庫
相對於其餘學術流派,CNCF 的 Cloud Native 定義更爲具體,偏向於軟件技術。這一點咱們從文中的一些關鍵字可以明顯地體會到,如關鍵字 "Containers(容器)"、"service meshes"、」microservices(微服務)「等。一般,開發人員較爲關注的 Cloud Native 基礎設施爲:「服務發現」、「負載均衡」、「服務網關」、「分佈式配置」、「服務熔斷」以及「跟蹤監控」,如圖所示:後端
因爲 PPT 格式的限制,此處我將「鏈路跟蹤」與「服務監控」 並陳爲「跟蹤監控」。接下來,咱們進入「服務發現」的討論。
服務發現(Service Discovery )
隨着微服務架構(MSA)受到不一樣規模企業的青睞,服務治理的實施逐漸被提上基礎設施改造的議程。儘管這些概念在 SOA 時代已經提出,然而引發業界普遍關注應歸功於微服務。服務發現(Service Discovery )做爲服務治理的核心特性,一般也將服務註冊(Service Registration)一併討論。不管是服務發現,仍是服務註冊,在具體落地實施時,它們必須面對技術選型的問題。在座的各位,包括我,大多數是 Java 程序員,天然關心 Java 的技術方案。目前,Java 社區最爲津津樂道的方案莫過於 Spring Cloud,搭配 Netflix OSS 組件 Eureka,幫助 Spring Boot 應用快速搭建服務發現體系。其中,Eureka Server 做爲註冊中心服務器,Spring Boot 應用整合 Eureka Client 向 Eureka Server 註冊。實際上,Spring Cloud 除了整合 Netflix Eureka 做爲服務發現以外,還提供了 Apache Zookeeper 和 HachiCorp Consul 的實現,因此這三種方案出如今當前頁面:
其中還包括 Redis 和 Apache Curator,前者是 Dubbo 的服務發現實現方案之一,然而小馬哥並不建議使用 Redis 做爲註冊中心,仍是保持它緩存中間件的單純性較好。而 Curator 做爲 Zookeeper Java 客戶端類庫,它不但可用在 Dubbo,並且其擴展項目 Curator Service Discovery 也是 Spring Cloud 整合 Zookeeper 做爲服務發現的關鍵基礎設施。或許你們思考以上方案應該如何選型的問題。
如何選擇
Eureka
當服務發現選型時,Netflix Eureka 或許是在開發人員腦海中復現的首選方案。然而 Eureka 在阿里大規模實踐時,它的表現並不理想,當 Eureka 客戶端服務實例數量達到必定時,Eureka Server 時常會出現服務不可用的狀況,主要的問題集中在更新(Update)機制、複製(Replication)機制以及內存型存儲。因爲時間的關係,此處我不加詳細說明,部分答案在 Eureka Wiki Eureka 2.0 Motivations 中也有描述:
Why Eureka 2.0?
Only support homogenous client views
Only supports scheduled updates
Replication algorithm limits scalability
注:以上具體內容在分享現場並無具體說起,此處特地爲讀者補充。
以上問題 Netflix 早在 2015 年已意識到,然而 Eureka 2.0 的發佈遙遙無期。後來,我託朋友聯繫上了 Netflix 的工程師,諮詢他們關於 Eureka 1 在自身生產環境的使用狀況。他們的回覆是部分場景在使用。這樣的答覆值得玩味,再細問其覆蓋比重,對方三緘其口。這不得不讓我對 Eureka 的成熟度產生了質疑,因此我不建議你們在數以千計的應用實例場景中使用。
Consul
Consul 一樣做爲 Spring Cloud 服務中心,基於 GO 語言開發,其數據一致性採用 Raft 算法,低內存,集羣支持。曾一度成爲我理想的替換 Eureka 的方案,不過本人並不具有 Consul 的大規模運用,爲此還特地請教永輝雲創的架構師翟永超(《Spring Cloud 微服務實戰》的做者)。他告知 Consul 表現不錯,並在跨 DC(數據中心)方面也比較穩定:
他的答覆讓我加強了 Consul 的信心,稍顯遺憾的是其 Consul 應用節點略少。後來,我據說 B 站的哥們自研服務發現中間件 discovery,他們應該也對 Consul 作過調研和評估,他們的見解是:
Github 開源地址:https://github.com/Bilibili/d...
discovery 在 B 站 K8S 上的使用狀況:
綜合兩家公司的評估,儘管沒有通過本人實際操做,而且二者沒有提供具體的數據指標,然而在必定程度上說明 Consul 做爲註冊中心的實例節點規模大概在 2k 之內。換言之,它比較適合中小型企業。
Zookeeper
Zookeeper 便可是 Spring Cloud 註冊中心,又能做爲 Dubbo 註冊中心,與 Eureka 不一樣,它屬於 CP 分佈式策略,然後者屬於 AP。二者的共同點在於均屬於內存型註冊中心,在大規模集羣場景,也會遇到 Eureka 相似的問題。不過從運維的角度,相較於 Eureka 而言,熟悉 Zookeeper 運維朋友更多。在生態性方面,Zookeeper 周邊的生態更豐富,如 Zookeeper C API,儘管 Eureka 提供了語言無關性的 REST 接口。同時,Zookeeper 還從當配置服務器的角色,下降了學習的成本。綜上結論,我推薦使用 Zookeeper 做爲服務發現基礎設施,不管您選擇 Dubbo 方案,仍是使用 Spring Cloud。儘管它在大規模集羣時也出現 Zookeeper 間歇性卡頓等問題。
負載均衡
負載均衡是第二個重要 Cloud Native 基礎設施,熟悉 Spring Cloud 的朋友必定對右側的蝴蝶結有印象,它就是 Netflix OSS 負載均衡組件 Ribbon,框架層面提供了多種負載均衡規則,如:
隨機 - RandomRule
輪循 - RoundRobinRule
權重響應時間 - WeightedResponseTimeRule
WeightedResponseTimeRule 以外,其餘的 Ribbon 負載均衡實現均沒有提供權重因子,而權重因子對於藍綠髮布、服務預熱等方面的幫助是相當重要的。所以,權重因子在 Dubbo 「隨機「、」輪詢「 以及 」最少活躍調用數「 負載均衡算法中均體現。
以上討論的兩種框架均屬於 Java 實現,而中間的 Kong 則是更爲通用的實現,一般它做爲 API 服務網關,後面咱們將繼續討論。可簡單地認爲它是 Nginx + Lua 的擴展,負載均衡天然成爲不可或缺的特性。其默認的負載均衡算法爲具有權重的輪詢(weighted-round-robin),同時一致性 Hash 算法做爲可選方案。
服務網關
談及服務網關,Java 工程師最容易想到的是 Spring Cloud Zuul。Zuul 是 Netflix 基於 Servlet API 開發的 Web 服務代理組件,在 Spring Cloud 使用場景中,它與 Eureka 和 Ribbon 整合,打造具有服務動態更新和負載均衡能力的服務網關。
最近,隨着 Spring Cloud Finchley 的發佈,Spring Cloud Zuul 的替代方案 Spring Cloud Gateway 孕育而生,不過官方的描述仍是比較謙虛謹慎,並無一刀切地引導開發人員從 Zuul 遷移到 Gateway 上來:
API Gateway built on top of the Spring Ecosystem, including: Spring 5, Spring Boot 2 and Project Reactor. Spring Cloud Gateway aims to provide a simple, yet effective way to route to APIs and provide cross cutting concerns to them such as: security, monitoring/metrics, and resiliency.
二者不一樣點在於,Zuul 運行在 Servlet 容器中,而 Gateway 並不像 Spring WebFlux 可以兼容 Servlet 3.1 運行時,而是必須依賴 Netty 的運行時,以及整合 Reactive 框架 Reactor,實現異步非阻塞網關。因爲近期對於 Spring 5 WebFlux 可以大幅提高應用性能的觀點甚囂塵上,實際上,沒有任何直接性能基準測試證實 WebFlux 可以加快程序執行速度,或許你們認爲個人觀點與主流格格不入,但是我要告訴你們的是,這個問題我在同事間驗證過不少次,大多數狀況,Reactive 並不沒有提高性能。就連 Spring 官方也認可這個觀點:
1.1.7. Performance vs scale
Performance has many characteristics and meanings. Reactive and non-blocking generally do not make applications run faster. They can, in some cases, for example if using the WebClient to execute remote calls in parallel. On the whole it requires more work to do things the non-blocking way and that can increase slightly the required processing time.
資源地址:https://docs.spring.io/spring...
同時,這裏提供一篇 Spring 5 WebFlux: Performance tests 的文章,在結尾部分給出告終論,做者坦言在速度上沒有明顯的提高,甚至從結果來看,速度稍微更糟糕:
No improvement in speed was observed with our reactive apps (the Gatling results are even slightly worse).
以上測試工程和結論是由開源項目 JHipster 的工程師給出,具有必定的客觀性和可信度。
資源地址:https://blog.ippon.tech/sprin...
換言之,基於 Reactor 開發的 Gateway 在性能可能並無明顯的提高。所以,Zuul 和 Gateway 的性能對比則演變爲 Servlet 容器和 Netty Web 容器的比較,感興趣的朋友能夠去網上尋找一些比較數據,二者的性能在伯仲間。
固然,我和在座的各位同樣,對 Java 的實現方案天然是情有獨鍾。然而我想說的是,身爲 Java 工程師,眼中不免有 Java,可是眼中不要只有 Java。Nginx 做爲當年著名 「C10K」 問題的解決方案,不管從鏈接數量,仍是資源消耗方面均優於 Java 實現。做爲技術人,應該具備更爲寬廣的胸懷,接納非我族類的氣魄,該放手的時候就放手。Nginx 做爲服務網關不失爲一種好的方案,然而它的動態性略爲不足,須要結合 Lua 腳本輔助完成,所以,OpenResty 和 Kong 這類方案脫穎而出。若是就 HTTP API 網關而言,我的認爲 Kong 的方案更佳,由於它提供完整的解決方案,包括前面討論的負載均衡(權重)、服務熔斷以及服務發現等特性。相似的特性在 CNCF 項目 Envoy 也有體現,它是另外一種高性能代理的方案,提供服務發現、健康和負載均衡。在協議上,自然支持 HTTP 和 HTTP/2,而通信協議支持 gRPC,建議你們予以高度關注。
值得一提的是,HTTP API 網關一般須要支持 sidecar,換言之,支撐網關服務的基礎設施必須提供服務發現的能力,就功能性而言,Zuul 和 Gateway 自身並不具有這樣的特性,須要搭配 Eureka 這樣組件,它們更像服務路由器的角色。
分佈式配置
左邊和中間的四種技術均爲 Spring Cloud 分佈式配置的底層存儲,其中 Git 爲版本式配置,而 JDBC 是從 Spring Cloud Edgware 版本開始支持,提供更爲通用和動態的配置源。這裏咱們又見到 Zookeeper 的聲影,從簡化運維的角度,能夠利用 Zookeeper 即承擔服務發現,也做爲分佈式配置的基礎設施。而最右邊的 etcd 是最近很是火的 Kubernetes 分佈式配置的 key-value 存儲,提供快速、簡單、安全和可高的解決方案。
服務熔斷
服務熔斷也很是讓開發人員聯想到 Spring Cloud Hystrix 技術,不過 Hystrix 並不是與 Spring Cloud 強耦合,固然 Dubbo 也能結合 Netflix Hystrix 框架提供服務熔斷的能力,後面部分將介紹 Dubbo 與 Hystrix 整合,提高 Dubbo 服務熔斷的能力。確切地說,Dubbo 所提供的能力是集羣容錯,包括 Failover 等模式。 Kong 也自然地支持服務熔斷的能力,因此它做爲 API 網關的特性是全面的。
鏈路跟蹤
以上鍊路跟蹤的基礎設施從左至右,分別爲 Zipkin、OpenTracing 以及 Jaeger,三者的靈感均來自於 Google 論文 Dapper。相對而言,Java 程序員可能更爲熟悉 Zipkin,由於它是 Spring Cloud Sleuth 首選方案,提供客戶端上報以及服務端聚合和 Dashboard 等功能。而 OpenTracing 和 Jaeger 是 CNCF 孵化項目,前者屬於開放的標準,提供多語言的適配實現,後者則由 Uber(優步)公司開發並開源的鏈路跟蹤項目,功能上與 Zipkin 相似,不過它基於 GO 語言開發,同時也提供 Java 客戶端。
OpenTracing 官網:http://opentracing.io/
jaeger 官網:https://www.jaegertracing.io/
服務監控
服務監控與鏈路跟蹤有所區別,主要用於監控應用系統或業務的指標數據,多是健康閾值,如 CPU 或 內存使用率,也能夠是業務指標,如最近一小時的用戶登陸量。一般採用 Metrics 方式暴露,可以使用客戶端推送或服務端拉取的方式傳輸 Metrics 信息到數據中心。一般 Metrics 數據與時間是存在對應關係,所以,基本上採用時序型數據庫來存儲,如圖中的 OpenTSDB。一般,Java 微服務應用會選擇 Spring Boot 框架做爲基礎設施,如我以前設計的監控架構就採用了 Spring Boot + OpenTSDB ,後端存儲基於 HBase。當時 Spring Boot Actuator Metrics 僅爲簡單的 Key Value 形式,天然 OpenTSDB 是理想的選擇。隨着 Spring Boot 2.0 開始支持 Micrometer 以後,使得 Spring Boot 的應用可以整合更多的 Micrometer 適配方案,其中名氣較大的就是圖中間的 Prometheus,它一樣也是 CNCF 的孵化項目。
固然服務監控不僅是 Metrics 方式,我所知道國內很多的公司採用了日誌收集的方案,並搭配 ELK(Elasticsearch, Logstash, Kibana) 架構,減小運維成本。假設您沒有使用該方案,或者僅使用了 Elasticsearch 的話,不管哪一種方案,圖形化界面的監控是必不可少的,所以我推薦 Grafana,該項目可以支持多種數據源,包括前文提到的 OpenTSDB、Prometheus 以及 ElasticSearch 等。由此,從數據採集、上報、聚合以及展現的特性上,這些基礎設施幫助 Cloud Native 應用構建服務監控的閉環。
本議程介紹了一些 Cloud Native 技術設施,接下里咱們繼續討論 Cloud Native 架構選型。
Cloud Native 架構選型
CNCF 架構體系
CNCF 體系做爲目前最熱門的架構選型之一,基本上圍繞着 Kubernetes 爲中心而構建。我的認爲,Java 業界和 CNCF 體系並無達成共識,如服務網關,CNCF 主打 Envoy,而 Java 主要的方案爲 Zuul 和 Spring Cloud Gateway。所以,我的建議是密切的關注 CNCF 的發展,不過個別孵化項目能夠先行,如 Prometheus 和 Jaeger 等。 至於 CNCF 與 Java 生態的整合和落地,還得有待時日。