在 TKE 上利用 HPA 實現業務的彈性伸縮
概述
Kubernetes Pod 水平自動擴縮(Horizontal Pod Autoscaler,如下簡稱 HPA)能夠基於 CPU 利用率、內存利用率和其餘自定義的度量指標自動擴縮 Pod 的副本數量,以使得工做負載服務的總體度量水平與用戶所設定的目標值匹配。本文將介紹和使用騰訊雲容器服務 TKE 的 HPA 功能實現 Pod 自動水平擴縮容。算法
使用場景
HPA 自動伸縮特性使容器服務具備很是靈活的自適應能力,可以在用戶設定內快速擴容多個 Pod 副原本應對業務負載的急劇飆升,也能夠在業務負載變小的狀況下根據實際狀況適當縮容來節省計算資源給其餘的服務,整個過程自動化無須人爲干預,很是適合服務波動較大,服務數量多且須要頻繁擴縮容的業務場景,如:電商服務、線上教育、金融服務等。服務器
原理概述
Pod 水平自動擴縮特性由 Kubernetes API 資源和控制器實現。資源利用指標決定控制器的行爲, 控制器會週期性的根據 Pod 資源利用狀況調整服務 Pod 的副本數量,以使得工做負載的度量水平與用戶所設定的目標值匹配。其擴縮容流程和說明以下:網絡
提示:目前這一功能處於 beta 版本,且 Pod 自動水平擴縮不適用於沒法擴縮的對象,好比 DaemonSet 資源。app
HPA Controller:控制 HPA 擴縮邏輯的控制組件。測試
Metrics Aggregator:度量指標聚合器。一般狀況下,控制器將從一系列的聚合 API(metrics.k8s.io
、custom.metrics.k8s.io
和 external.metrics.k8s.io
)中獲取度量值。 metrics.k8s.io
API 一般由 Metrics 服務器提供,社區版可提供基本的 CPU、內存度量類型,相比於社區版,TKE 使用自定義 Metrics Server 採集可支持更普遍的的 HPA 的度量指標觸發類型,提供包括 CPU 、內存、硬盤、網絡和 GPU 相關指標,瞭解更多詳細內容參閱 TKE 自動伸縮指標說明。url
提示:控制器也能夠直接從 Heapster 獲取指標。但自 Kubernetes 1.11 起,從 Heapster 獲取指標特性的方式已廢棄。.net
HPA 計算目標副本數算法:TKE HPA 擴縮容算法請參考 工做原理,更多詳細算法請參閱 算法細節。3d
前提條件
- 已 註冊騰訊雲帳戶。
- 已登陸 騰訊雲容器服務控制檯。
- 已建立 TKE 集羣。關於建立集羣,詳情請參見 建立集羣。
操做步驟
第 1 步:部署測試工做負載rest
以 Deployment 資源類型的工做負載爲例,建立一個單副本數,服務類型爲 WEB 服務的 "hpa-test" 工做負載,在 TKE 控制檯建立Deployment 類型工做負載方法請參閱 Deployment 管理。本示例建立結果以下圖所示:code
第 2 步:配置 HPA
在 TKE 控制檯爲測試工做負載綁定一個 HPA 配置,關於如何綁定配置 HPA 請參閱 HPA 操做步驟 ,本示例配置當網絡出帶寬達到0.15Mbps(150Kbps) 時觸發擴容的策略。
第 3 步:功能驗證
在集羣中啓動一個臨時 Pod 對配置的 HPA 功能進行測試(模擬客戶端):
kubectl run -it --image alpine hpa-test --restart=Never --rm /bin/sh
在臨時 Pod 中運行下面命令短期內模擬大量請求訪問 "hpa-test" 服務使出口流量帶寬增大:
# hpa-test.default.svc.cluster.local 爲服務在集羣中的域名,當須要中止腳本時按 Ctrl+C 便可 while true; do wget -q -O - hpa-test.default.svc.cluster.local; done
在測試 Pod 中執行模擬請求命令後,經過觀察下圖中工做負載的 Pod 數量監控能夠看到,在 16:21 分時工做負載擴容副本數量至 2 個,由此可推斷出已經觸發了 HPA 的擴容事件。
再經過下圖的工做負載的網絡出口帶寬監控能夠看出在 16:21 右左時網絡出口帶寬增至大概 199 Kbps,已經超過 HPA 設定的網絡出口帶寬目標值,進一步證實此時觸發 HPA 擴縮容算法 擴容了一個副本數來知足設定的目標值,故工做負載的副本數量變成了 2 個。
注意:HPA 擴縮容算法 不僅以公式計算維度去控制擴縮容邏輯,而會多維度去衡量是否須要擴容或縮容,詳情能夠參閱 算法細節,因此在實際狀況中可能和預期會稍有誤差。
接下來模擬縮容過程,在 16:24 左右手動中止執行模擬請求的命令, 從下圖監控看到此時網絡出口帶寬值降低到擴容前位置,按照 HPA 的邏輯,此時已經知足工做負載縮容的條件。
但從下圖工做負載的 Pod 數量監控能夠看出,工做負載在 16:30 分時才觸發了 HPA 的縮容,這是由於觸發了 HPA 縮容有默認 5 分鐘的容忍時間的算法,以防止度量指標短期波動致使的頻繁的擴縮容,詳情請參閱 冷卻/延遲支持。從下圖能夠看出工做負載副本數在中止命令 5 分鐘後按照 HPA 擴縮容算法 縮容到了最初設定的 1 個副本數。
當 TKE 發生 HPA 擴縮容事件時,會在對應的 HPA 實例的事件列表展現,以下圖所示。須要注意的是事件通知列表的時間分爲 「首次出現時間」 和 「最後出現時間」,「首次出現時間」 表示相同事件第一次出現的時間,」最後出現時間」 爲相同事件出現的最新時間,因此從下圖事件列表 「最後出現時間」 字段能夠看到本示例擴容事件時間點是16:21:03,縮容事件時間是16.29:42,時間點與工做負載監控看到的時間點相吻合。
此外,工做負載事件列表也會記錄 HPA 發生時工做負載的增刪副本數事件,從下圖能夠看出工做負載擴縮容時間點與 HPA 事件列表的時間點也是吻合的,增長副本數時間點是 16:21:03,減小副本數時間點是 16: 29:42。
總結
在本示例中主要演示了 TKE 的 HPA 功能, 使用 TKE 自定義的網絡出口帶寬度量類型做爲工做負載 HPA 的擴縮容度量指標,當工做負載實際度量值超過 HPA 配置的度量目標值時, HPA 根據擴容算法計算出合適的副本數實現水平擴容,保證工做負載的度量指標知足預期,保障工做負載健康穩定運行;當實際度量值遠低於 HPA 配置的度量目標值時,HPA 會在容忍時間後計算合適的副本數實現水平縮容,適當釋放閒置資源,達到提高資源利用率的目的,而且整個過程在 HPA 和工做負載事件列表都會有相應的事件記錄,使整個工做負載水平擴縮容全程可追溯。
【騰訊雲原生】雲說新品、雲研新術、雲遊新活、雲賞資訊,掃碼關注同名公衆號,及時獲取更多幹貨!!