Java分佈式開發不得不知的Dubbo技術詳細介紹

1 dubbox簡介

隨着互聯網的發展,網站應用的規模不斷擴大,常規的垂直應用架構已沒法應對,分佈式服務架構以及流動計算架構勢在必行,亟需一個治理系統確保架構有條不紊的演進。前端

file

  • 單一應用架構
  • 當網站流量很小時,只需一個應用,將全部功能都部署在一塊兒,以減小部署節點和成本。
  • 此時,用於簡化增刪改查工做量的 數據訪問框架(ORM) 是關鍵。
  • 垂直應用架構
  • 當訪問量逐漸增大,單一應用增長機器帶來的加速度愈來愈小,將應用拆成互不相干的幾個應用,以提高效率。
  • 此時,用於加速前端頁面開發的 Web框架(MVC) 是關鍵。
  • 分佈式服務架構
  • 當垂直應用愈來愈多,應用之間交互不可避免,將核心業務抽取出來,做爲獨立的服務,逐漸造成穩定的服務中心,使前端應用能更快速的響應多變的市場需求。
  • 此時,用於提升業務複用及整合的 分佈式服務框架(RPC) 是關鍵。
  • 流動計算架構
  • 當服務愈來愈多,容量的評估,小服務資源的浪費等問題逐漸顯現,此時需增長一個調度中心基於訪問壓力實時管理集羣容量,提升集羣利用率。
  • 此時,用於提升機器利用率的 資源調度和治理中心(SOA) 是關鍵。

dubbox是dubbo的擴展,主要在dubbo的基礎上進行了一下的改進:算法

一、支持REST風格遠程調用(HTTP + JSON/XML):基於很是成熟的JBoss RestEasy框架,在dubbo中實現了REST風格(HTTP + JSON/XML)的遠程調用,以顯著簡化企業內部的跨語言交互,同時顯著簡化企業對外的Open API、無線API甚至AJAX服務端等等的開發。事實上,這個REST調用也使得Dubbo能夠對當今特別流行的「微服務」架構提供基礎性支持。 另外,REST調用也達到了比較高的性能,在基準測試下,HTTP + JSON與Dubbo 2.x默認的RPC協議(即TCP + Hessian2二進制序列化)之間只有1.5倍左右的差距,詳見文檔中的基準測試報告。spring

二、支持基於Kryo和FST的Java高效序列化實現:基於當今比較知名的Kryo和FST高性能序列化庫,爲Dubbo默認的RPC協議添加新的序列化實現,並優化調整了其序列化體系,比較顯著的提升了Dubbo RPC的性能,詳見文檔中的基準測試報告。數據庫

三、支持基於Jackson的JSON序列化:基於業界應用最普遍的Jackson序列化庫,爲Dubbo默認的RPC協議添加新的JSON序列化實現。緩存

四、支持基於嵌入式Tomcat的HTTP remoting體系:基於嵌入式tomcat實現dubbo的HTTP remoting體系(即dubbo-remoting-http),用以逐步取代Dubbo中舊版本的嵌入式Jetty,能夠顯著的提升REST等的遠程調用性能,並將Servlet API的支持從2.5升級到3.1。(注:除了REST,dubbo中的WebServices、Hessian、HTTP Invoker等協議都基於這個HTTP remoting體系)。tomcat

五、升級spring:將dubbo中Spring由2.x升級到目前最經常使用的3.x版本,減小版本衝突帶來的麻煩。安全

六、升級ZooKeeper客戶端:將dubbo中的zookeeper客戶端升級到最新的版本,以修正老版本中包含的bug。服務器

七、支持徹底基於Java代碼的Dubbo配置:基於Spring的Java Config,實現徹底無XML的純Java代碼方式來配置dubbo網絡

八、調整Demo應用:暫時將dubbo的demo應用調整並改寫以主要演示REST功能、Dubbo協議的新序列化方式、基於Java代碼的Spring配置等等。九、修正了dubbo的bug 包括配置、序列化、管理界面等等的bug。多線程

2 dubbo架構構成

dubbo運行架構以下圖示:

file

  • 節點角色說明:

一、Provider:暴露服務的服務提供方。Consumer: 調用遠程服務的服務消費方。

二、Registry:服務註冊與發現的註冊中心。Monitor: 統計服務的調用次調和調用時間的監控中心。

三、Container: 服務運行容器。

  • 調用關係說明:

一、服務容器負責啓動,加載,運行服務提供者。

二、服務提供者在啓動時,向註冊中心註冊本身提供的服務。

三、服務消費者在啓動時,向註冊中心訂閱本身所需的服務。

四、註冊中心返回服務提供者地址列表給消費者,若是有變動,註冊中心將基於長鏈接推送變動數據給消費者。

五、服務消費者,從提供者地址列表中,基於軟負載均衡算法,選一臺提供者進行調用,若是調用失敗,再選另外一臺調用。

六、服務消費者和提供者,在內存中累計調用次數和調用時間,定時每分鐘發送一次統計數據到監控中心。

3 dubbo的特性

(1) 連通性:

註冊中心負責服務地址的註冊與查找,至關於目錄服務,服務提供者和消費者只在啓動時與註冊中心交互,註冊中心不轉發請求,壓力較小監控中心負責統計各服務調用次數,調用時間等,統計先在內存彙總後每分鐘一次發送到監控中心服務器,並以報表展現服務提供者向註冊中心註冊其提供的服務,並彙報調用時間到監控中心,此時間不包含網絡開銷服務消費者向註冊中心獲取服務提供者地址列表,並根據負載算法直接調用提供者,同時彙報調用時間到監控中心,此時間包含網絡開銷註冊中心,服務提供者,服務消費者三者之間均爲長鏈接,監控中心除外註冊中心經過長鏈接感知服務提供者的存在,服務提供者宕機,註冊中心將當即推送事件通知消費者註冊中心和監控中心所有宕機,不影響已運行的提供者和消費者,消費者在本地緩存了提供者列表

註冊中心和監控中心都是可選的,服務消費者能夠直連服務提供者

(2) 健狀性:

監控中心宕掉不影響使用,只是丟失部分採樣數據數據庫宕掉後,註冊中心仍能經過緩存提供服務列表查詢,但不能註冊新服務註冊中心對等集羣,任意一臺宕掉後,將自動切換到另外一臺註冊中心所有宕掉後,服務提供者和服務消費者仍能經過本地緩存通信服務提供者無狀態,任意一臺宕掉後,不影響使用服務提供者所有宕掉後,服務消費者應用將沒法使用,並沒有限次重連等待服務提供者恢復

(3) 伸縮性:

註冊中心爲對等集羣,可動態增長機器部署實例,全部客戶端將自動發現新的註冊中心

服務提供者無狀態,可動態增長機器部署實例,註冊中心將推送新的服務提供者信息給消費者

(4) 升級性:

當服務集羣規模進一步擴大,帶動IT治理結構進一步升級,須要實現動態部署,進行流動計算,現有分佈式服務架構不會帶來阻力:

file

4 dubbo的調用方式

  • 異步調用

基於NIO的非阻塞實現並行調用,客戶端不須要啓動多線程便可完成並行調用多個遠程服務,相對多線程開銷較小。

file

  • 本地調用

本地調用,使用了Injvm協議,是一個僞協議,它不開啓端口,不發起遠程調用,只在JVM內直接關聯,但執行Dubbo的Filter鏈。

file

5 dubbo支持的註冊中心

Dubbo提供的註冊中心有以下幾種類型可供選擇:

  • Multicast註冊中心
  • Zookeeper註冊中心
  • Redis註冊中心
  • Simple註冊中心

ZooKeeper是一個開源的分佈式服務框架,它是Apache Hadoop項目的一個子項目,主要用來解決分佈式應用場景中存在的一些問題,如:統一命名服務、狀態同步服務、集羣管理、分佈式應用配置管理等,它支持Standalone模式和分佈式模式,在分佈式模式下,可以爲分佈式應用提供高性能和可靠地協調服務,並且使用ZooKeeper能夠大大簡化分佈式協調服務的實現,爲開發分佈式應用極大地下降了成本。

ZooKeeper整體架構

file

ZooKeeper集羣由一組Server節點組成,這一組Server節點中存在一個角色爲Leader的節點,其餘節點都爲Follower。當客戶端Client鏈接到ZooKeeper集羣,而且執行寫請求時,這些請求會被髮送到Leader節點上,而後Leader節點上數據變動會同步到集羣中其餘的Follower節點。

6 dubbo支持的遠程通訊協議

遠程通訊須要指定通訊雙方所約定的協議,在保證通訊雙方理解協議語義的基礎上,還要保證高效、穩定的消息傳輸。Dubbo繼承了當前主流的網絡通訊框架,主要包括以下幾個:

  • Mina
  • Netty
  • Grizzly

file

7 dubbo支持的遠程調用協議

Dubbo支持多種協議,以下所示:

  • Dubbo協議
  • Hessian協議
  • HTTP協議
  • RMI協議
  • WebService協議
  • Thrift協議
  • Memcached協議
  • Redis協議

file

在通訊過程當中,不一樣的服務等級通常對應着不一樣的服務質量,那麼選擇合適的協議即是一件很是重要的事情。你能夠根據你應用的建立來選擇。例如,使用RMI協議,通常會受到防火牆的限制,因此對於外部與內部進行通訊的場景,就不要使用RMI協議,而是基於HTTP協議或者Hessian協議。

8 dubbo集羣容錯和負載均衡

一、集羣容錯 在集羣調用失敗時,Dubbo提供了多種容錯方案,缺省爲failover重試。

  • Failover Cluster
    失敗自動切換,當出現失敗,重試其它服務器。(缺省)
    一般用於讀操做,但重試會帶來更長延遲。
    可經過retries=「2」來設置重試次數(不含第一次)。
  • Failfast Cluster
    快速失敗,只發起一次調用,失敗當即報錯。
    一般用於非冪等性的寫操做,好比新增記錄。
  • Failsafe Cluster
    失敗安全,出現異常時,直接忽略。
    一般用於寫入審計日誌等操做。
  • Failback Cluster
    失敗自動恢復,後臺記錄失敗請求,定時重發。
    一般用於消息通知操做。
  • Forking Cluster
    並行調用多個服務器,只要一個成功即返回。
    一般用於實時性要求較高的讀操做,但須要浪費更多服務資源。
    可經過forks=「2」來設置最大並行數。
  • Broadcast Cluster
    廣播調用全部提供者,逐個調用,任意一臺報錯則報錯。(2.1.0開始支持)
    一般用於通知全部提供者更新緩存或日誌等本地資源信息。

二、負載均衡

  • Random LoadBalance隨機,按權重設置隨機機率。
    在一個截面上碰撞的機率高,但調用量越大分佈越均勻,並且按機率使用權重後也比較均勻,有利於動態調整提供者權重。
  • RoundRobin LoadBalance 輪循,按公約後的權重設置輪循比率。
    存在慢的提供者累積請求問題,好比:第二臺機器很慢,但沒掛,當請求調到第二臺時就卡在那,長此以往,全部請求都卡在調到第二臺上。
  • LeastActive LoadBalance 最少活躍調用數,相同活躍數的隨機,活躍數指調用先後計數差。
    使慢的提供者收到更少請求,由於越慢的提供者的調用先後計數差會越大。
  • ConsistentHash LoadBalance 一致性Hash,相同參數的請求老是發到同一提供者。
    當某一臺提供者掛時,本來發往該提供者的請求,基於虛擬節點,平攤到其它提供者,不會引發劇烈變更。

配置如:

file

9 dubbo源代碼結構

file

Dubbo以包結構來組織各個模塊,各個模塊及其關係,如圖所示:

file

  • dubbo-common 公共邏輯模塊,包括Util類和通用模型。
  • dubbo-remoting 遠程通信模塊,至關於Dubbo協議的實現,若是RPC用RMI協議則不須要使用此包。
  • dubbo-rpc 遠程調用模塊,抽象各類協議,以及動態代理,只包含一對一的調用,不關心集羣的管理。
  • dubbo-cluster 集羣模塊,將多個服務提供方假裝爲一個提供方,包括:負載均衡、容錯、路由等,集羣的地址列表能夠是靜態配置的,也能夠是由註冊中心下發。
  • dubbo-registry 註冊中心模塊,基於註冊中心下發地址的集羣方式,以及對各類註冊中心的抽象。
  • dubbo-monitor 監控模塊,統計服務調用次數,調用時間的,調用鏈跟蹤的服務。
  • dubbo-config 配置模塊,是Dubbo對外的API,用戶經過Config使用Dubbo,隱藏Dubbo全部細節。
  • dubbo-Container 容器模塊,是一個Standalone的容器,以簡單的Main加載Spring啓動,由於服務一般不須要Tomcat/JBoss等Web容器的特性,不必用Web容器去加載服務。

10 Dubbo內核實現之SPI簡單介紹

Dubbo採用微內核+插件體系,使得設計優雅,擴展性強。那所謂的微內核+插件體系是如何實現的呢!即咱們定義了服務接口標準,讓廠商去實現(若是不瞭解spi的請谷歌百度下), jdk經過ServiceLoader類實現spi機制的服務查找功能。

JDK實現spi服務查找: ServiceLoader

首先定義下示例接口

file

A廠商提供實現

file

com.a.example.SpiAImpl #廠商A的spi實現全路徑類名

B廠商提供實現

file

com.b.example.SpiBImpl #廠商B的spi實現全路徑類名

ServiceLoader.load(Spi.class)讀取廠商A、B提供jar包中的文件,ServiceLoader實現了Iterable接口可經過while for循環語句遍歷出全部實現。

一個接口多種實現,就如策略模式同樣提供了策略的實現,可是沒有提供策略的選擇, 使用方能夠根據isSupport方法根據業務傳入廠商名來選擇具體的廠商。

file

定義了@SPI註解

file

具體實現的類有:

file

因此說:Remoting實現是Dubbo協議的實現.

如何一塊兒學習,有沒有免費資料?

file

本文由博客一文多發平臺 OpenWrite 發佈!

相關文章
相關標籤/搜索