教程:一塊兒學習Hystrix--服務（依賴）失敗場景的表象

時間 2019-11-09

標籤教程一塊兒學習 hystrix 服務依賴失敗場景表象欄目設計模式简体版

原文原文鏈接

Hystrix本系列博文

如下爲博主寫Hystrix系列的文章列表以下:api

點擊查看 Hystrix入門分佈式

點擊查看 Hystrix命令執行spa

點擊查看 Hystrix處理異常機制(降級方法).net

點擊查看 Hystrix命令名稱、分組、線程池線程

點擊查看 Hystrix命令名稱、Hystrix請求處理blog

點擊查看 Hystrix請求處理事件

點擊查看 Hystrix經常使用場景--失敗內存

點擊查看 Hystrix經常使用場景--降級(回退)get

點擊查看 Hystrix斷路器配置及使用場景入門

依賴失敗的表象

在分佈式系統中，最典型的失敗類型是單個依賴失敗或休眠，而其餘全部的都保持健康。在這些狀況下，度量和指示板很是明顯地顯示正在發生的事情：

上面的截圖顯示了一個帶有20%錯誤率的單電路：高到足以產生影響，但還不足以啓動斷路器。其餘三個電路不受影響。

在這個特定的例子中，是實際的錯誤，而不是延遲，這致使了問題——就像紅色數字而不是橙色顯示的那樣。

在同一事件中，捕捉到了如下圖表，如下圖標顯示這條線路的歷史趨勢，以及在故障和降級中是如何急劇上升的。

依賴失敗觸發回退的表象

這個圖表是另外一個單電路故障的屏幕截圖，注意有99.5%的延遲很是高。這是底層工做線程要完成的時間，這將使線程池飽和，並致使調用線程超時。

在集羣中，除了一臺機器以外，全部的機器都有斷路器被熔斷，這就致使了大多數流量被短路（藍色），而在一臺仍然嘗試大多數請求的機器上被超時了（橙色）。

注意，其餘的電路是健康的，左邊的線圖顯示的是返回時長500s沒有增長，由於這個電路正在返回一個回退操做，這樣用戶就會收到一個降級但仍然有用的體驗。

級聯失敗的表象

下面的屏幕截圖表明瞭一個系統的失敗（高延遲狀況），這個系統很大程度上依賴於許多其餘系統，所以故障也會在它們之間發生。Netflix的API系統必須可以抵禦延遲和失敗，不單單由於單一的根本緣由，而是全部受到它影響的系統。

下面的截圖顯示了6個電路，表明了三個不一樣的系統：

在這一事件發生時，Hystrix仍然主要是一個「netflix-api」的東西。隨着Hystrix在愈來愈多的團隊中運轉，這進一步限制了級聯失敗的影響，以下圖所示：

服務本身失敗而不是依賴失敗的表象

若是全部的電路看起來都很糟糕（儀表板都被點亮了），那麼頗有可能問題是本身系統，而不是全部的依賴項同時發生。

致使這種問題的兩個案例以下：

系統過載（高負載，CPU使用率等）。

這可能發生的一個例子是，若是自動伸縮策略失敗了，或者在流量激增的狀況下沒法快速伸縮，機器接收的流量超出了它們的處理能力。

內存泄漏最終會致使GC抖動，從而竊取CPU並致使暫停，從而致使電路超時、備份和拒絕

聲明

轉帖請註明原貼地址： https://my.oschina.net/u/2342969/blog/1820306

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。