— 장애가 터지기 전에 먼저 보이는 것들관리형 쿠버네티스 장애 유형을 보면 공통점이 있다.대부분 갑자기 터진 것처럼 보이지만,사실은 그 전에 이미 신호를 보내고 있었다는 점이다.OOMKilled 전에 메모리는 계속 차오른다Evicted 전에 Node 리소스는 이미 임계치에 근접한다a서비스가 느려지기 전 CPU throttling은 먼저 발생한다이 글에서는쿠버네티스 운영에서 “최소한 이것만은 봐야 하는” 모니터링 신호들을우선순위 중심으로 정리한다.툴이 아니라 지표와 관점에 집중한다.모니터링의 목적부터 다시 잡자쿠버네티스에서 모니터링의 목적은 명확하다.“장애를 분석하기 위함”이 아니라“장애를 미리 알아차리기 위함”이다.그래서 다음 기준이 중요하다.지금 안 봐도 되는 지표는 무엇인가지금 반드시 봐야 하는 지표..