Kublet PLEG不健康問題排障

時間 2020-02-06

標籤 kublet pleg 不健康問題排障简体版

原文原文鏈接

環境：Rancher管控的K8S集羣。git

現象：某個Node頻繁出現「PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s」錯誤，頻率在5-10分鐘就會出現一次。github

排查：docker

kubectl get pods --all-namespaces 發現有一個istio-ingressgateway-6bbdd58f8c-nlgnd一直處於Terminating狀態，也就是說殺不死。

到Node上docker logs --tail 100 kubelet也看到這個Pod的狀態異常：spa

I0218 01:21:17.383650   10311 kubelet.go:1775] skipping pod synchronization - [PLEG is not healthy: pleg was last seen active 3m46.752815514s ago; threshold is 3m0s]
...
E0218 01:21:30.654433   10311 generic.go:271] PLEG: pod istio-ingressgateway-6bbdd58f8c-nlgnd/istio-system failed reinspection: rpc error: code = DeadlineExceeded desc = context deadline exceeded

用kubelet delete pod嘗試刪除，命令掛住。
用kubectl delete pod --force --grace-period=0，強制刪除Pod。
再到Node上檢查這個容器是否真的被中止，docker ps -a| grep ingressgateway-6bbdd58f8c-nlgnd，看到容器處於Exited狀態。
觀察Node狀態，問題依舊。
把Pod關聯的Deployment刪除，把一隻處於Terminating的Pod用kubectl delete pod --force --grace-period=0的方式刪除。
從新部署Deployment。
問題解決。

相關issuecode

1. 程序員常見的健康問題
2. nginx健康檢查導致的問題
3. 健康債你欠不起
4. 健康
5. 健康問診--文檔
6. Jenkins 健康檢查顧問
7. 健康之路面試題
8. 春季要健康　「排毒」三步走
9. 健康第一
10. 關於健康
更多相關文章...
• Markdown 標題 - Markdown 教程
• jQuery Mobile 主題 - jQuery Mobile 教程
• IntelliJ IDEA中SpringBoot properties文件不能自動提示問題解決
• PHP Ajax 跨域問題最佳解決方案

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。