K8S資源回收機制

時間 2021-03-14

標籤 node docker 服務器 ide 日誌 blog 資源文檔 get kubernetes 欄目 Docker 简体版

原文原文鏈接

原文：https://kubernetes.io/docs/tasks/administer-cluster/out-of-resource/node

一問題現象
服務器的磁盤空間爆滿（90%以上），觸發某種機制，致使大量pod處於被驅逐狀態（Evicted），大部分鏡像被刪除，全部服務均不可用。docker

二問題追蹤
發現服務器的存儲達到某個狀態（假如是超過90%）後會刪除自身的一些資源，比較明顯的是刪除了大量的鏡像，所以會出現一些pod的狀態是鏡像下載失敗，包括k8s自身的系統鏡像。服務器自己並不存在自動清理根目錄，除非是寫自動清理的腳本。排查了一圈，並不存在，所以極大機率是k8s本身給刪的。我在官方的一篇文檔中，找到了這個機制。服務器

三機制說明
每一個node上的kubelet都負責按期採集資源佔用數據，並與預設的 threshold值進行比對，若是超過 threshold值，kubelet就會嘗試殺掉一些Pod以回收相關資源，對Node進行保護。kubelet關注的資源指標threshold大約有以下幾種：ide

memory.available
nodefs.available
nodefs.inodesFree
imagefs.available
imagefs.inodesFree

每種threshold又分爲eviction-soft和eviction-hard兩組值。soft和hard的區別在於前者在到達threshold值時會給pod一段時間優雅退出，然後者則崇尚「暴力」，直接殺掉pod，沒有任何優雅退出的機會。這裏還要提一下nodefs和imagefs的區別：日誌

nodefs: 指node自身的存儲，存儲daemon的運行日誌等，通常指root分區/；
imagefs: 指docker daemon用於存儲image和容器可寫層(writable layer)的磁盤；
在我遇到的問題中，咱們的imagefs和nodefs分區是同一個分區，即/分區，佔用率很高（96%)。列一下其中一些指標的閾值：blog

memory.available<100Mi
nodefs.available<10%
nodefs.inodesFree<5%
imagefs.available<15%
（至於其餘的指標閾值爲啥沒有，由於我沒找到。）資源

其中比較重要的動做，就是達到nodefs和imagefs的閾值後的回收機制。文檔