문제 해결 가이드

최종 수정: 2026. 3. 27.

에이전트 설치 문제

에이전트 Pod가 시작되지 않음

증상: kubectl get pods -n skuber-system에서 Pod가 실행 중이 아님

확인 단계:

# 1. Pod 상태 확인
kubectl get pods -n skuber-system -o wide

# 2. Pod 이벤트 확인
kubectl describe pod -n skuber-system <pod-name>

# 3. 로그 확인
kubectl logs -n skuber-system <pod-name>

일반적인 원인과 해결:

상태 원인 해결
이미지 풀 실패 이미지 레지스트리 접근 불가 아웃바운드 HTTPS 허용 확인
크래시 루프 설정 오류 설치 스크립트의 파라미터 확인
대기 중 리소스 부족 노드에 충분한 CPU/메모리 확보

에이전트 재설치

기존 에이전트를 제거하고 재설치합니다:

# 1. 기존 Agent 제거
kubectl delete namespace skuber-system

# 2. 네임스페이스 삭제 확인
kubectl get namespace skuber-system

# 3. 재설치
# Console에서 설치 스크립트를 다시 복사하여 실행

연결 문제

클러스터 상태가 DISCONNECTED

원인 1: 에이전트 Pod 다운

kubectl get pods -n skuber-system
# → Pod가 Running이 아니면 Agent 문제

원인 2: 네트워크 차단

# Agent에서 API 서버 접근 확인
kubectl exec -n skuber-system <agent-pod> -- curl -s https://api.skuberplus.com/health

원인 3: 인증 오류

# Agent 로그에서 인증 관련 오류 확인
kubectl logs -n skuber-system -l app=skuber-agent --tail=100 | grep -i "auth\|token\|unauthorized"

비용 데이터 문제

비용이 $0으로 표시됨

  1. 에이전트 연결 후 최대 1일 대기 (데이터 수집 및 비용 산출 소요)
  2. 클러스터 상태가 연결됨인지 확인
  3. 노드 인스턴스 가격 정보가 수집되었는지 확인

비용이 비정상적으로 높거나 낮음

  • 노드 수가 실제와 일치하는지 확인 (Sync 버튼 클릭)
  • Custom Instance 타입의 가격이 정확한지 확인

최적화 문제

VPA 권장값이 표시되지 않음

  • 워크로드 목록에서 해당 워크로드의 VPA 상태가 **적용 가능(Applicable)**인지 확인
  • 에이전트 설치 후 최소 5분 대기 필요 (데이터 수집 기간)

제로 스케일링 후 Pod가 스케일 업되지 않음

  1. 에이전트 Pod 상태 확인
  2. 서비스의 Endpoints 확인
  3. Ingress/Service가 정상 구성되어 있는지 확인
# Endpoints 확인
kubectl get endpoints <service-name> -n <namespace>

# Service 확인
kubectl describe service <service-name> -n <namespace>

노드 스케줄 실행 실패

  1. 히스토리에서 실패 원인 확인
  2. 노드 정책 설정이 유효한지 확인
  3. 클라우드 API 권한 확인 (노드 추가/삭제 권한)

Agent 제거

에이전트 제거는 반드시 Console UI의 클러스터 관리에서 클러스터 삭제를 통해 진행하세요.

⚠️ 주의: UI를 통해 클러스터를 삭제하지 않고 kubectl delete namespace skuber-system으로 강제 삭제하면 정상적으로 제거가 진행되지 않습니다. 반드시 Console에서 삭제하세요.

추가 지원

문제가 해결되지 않으면 지원팀에 문의하세요.

기술 지원: support@skuberplus.com