AWS EKS在Auto Scaling之後pod卡住的問題

Hachibye
Jun 21, 2024

--

Pods stuck in Terminating status

結論:

  1. 稍等片刻
  2. 強制刪除卡住的pod以釋放給node調度pod空間
#強制刪除卡住的程序
kubectl delete pod <podname> -n <namespace> --force

逐步檢查:

Auto Scaling群組(AWS -> EC2 / EKS)

檢查配置

當前策略是最小三台,最大三台

若有一台不可用,將會水平擴展至三台

測試停止一台之後會再啟動一台

查看node狀態

停止的那台節點已經變成 NotReady, SchedulingDisabled

查看pod狀態

在不可用節點上的pod逐漸停止(terminating)

若node尚未起來,pod會停留在pending階段等待

查看監控報表

pod正在逐漸移動到新的節點上

節點恢復ready

pod恢復running

--

--

Hachibye
Hachibye

Written by Hachibye

字幕組退休勞工 ... DevOps/系統/雲端/資安

No responses yet