如下爲博主寫Hystrix系列的文章列表以下:api
點擊查看 Hystrix入門分佈式
點擊查看 Hystrix命令執行spa
點擊查看 Hystrix處理異常機制(降級方法).net
點擊查看 Hystrix命令名稱、分組、線程池線程
點擊查看 Hystrix命令名稱、Hystrix請求處理blog
點擊查看 Hystrix請求處理事件
點擊查看 Hystrix經常使用場景--失敗內存
點擊查看 Hystrix經常使用場景--降級(回退)get
點擊查看 Hystrix斷路器配置及使用場景入門
在分佈式系統中,最典型的失敗類型是單個依賴失敗或休眠,而其餘全部的都保持健康。 在這些狀況下,度量和指示板很是明顯地顯示正在發生的事情:
上面的截圖顯示了一個帶有20%錯誤率的單電路:高到足以產生影響,但還不足以啓動斷路器。其餘三個電路不受影響。
在這個特定的例子中,是實際的錯誤,而不是延遲,這致使了問題——就像紅色數字而不是橙色顯示的那樣。
在同一事件中,捕捉到了如下圖表,如下圖標顯示這條線路的歷史趨勢,以及在故障和降級中是如何急劇上升的。
這個圖表是另外一個單電路故障的屏幕截圖,注意有99.5%的延遲很是高。 這是底層工做線程要完成的時間,這將使線程池飽和,並致使調用線程超時。
在集羣中,除了一臺機器以外,全部的機器都有斷路器被熔斷,這就致使了大多數流量被短路(藍色),而在一臺仍然嘗試大多數請求的機器上被超時了(橙色)。
注意,其餘的電路是健康的,左邊的線圖顯示的是返回時長500s沒有增長,由於這個電路正在返回一個回退操做,這樣用戶就會收到一個降級但仍然有用的體驗。
下面的屏幕截圖表明瞭一個系統的失敗(高延遲狀況),這個系統很大程度上依賴於許多其餘系統,所以故障也會在它們之間發生。Netflix的API系統必須可以抵禦延遲和失敗,不單單由於單一的根本緣由,而是全部受到它影響的系統。
下面的截圖顯示了6個電路,表明了三個不一樣的系統:
在這一事件發生時,Hystrix仍然主要是一個「netflix-api」的東西。隨着Hystrix在愈來愈多的團隊中運轉,這進一步限制了級聯失敗的影響,以下圖所示:
若是全部的電路看起來都很糟糕(儀表板都被點亮了),那麼頗有可能問題是本身系統,而不是全部的依賴項同時發生。
致使這種問題的兩個案例以下:
這可能發生的一個例子是,若是自動伸縮策略失敗了,或者在流量激增的狀況下沒法快速伸縮,機器接收的流量超出了它們的處理能力。
轉帖請註明原貼地址: https://my.oschina.net/u/2342969/blog/1820306