문제 해결 가이드 - Skuber⁺ Cost Optimize

에이전트 설치 문제

에이전트 Pod가 시작되지 않음

증상: kubectl get pods -n skuber-system에서 Pod가 실행 중이 아님

확인 단계:

# 1. Pod 상태 확인
kubectl get pods -n skuber-system -o wide

# 2. Pod 이벤트 확인
kubectl describe pod -n skuber-system <pod-name>

# 3. 로그 확인
kubectl logs -n skuber-system <pod-name>

일반적인 원인과 해결:

상태	원인	해결
이미지 풀 실패	이미지 레지스트리 접근 불가	아웃바운드 HTTPS 허용 확인
크래시 루프	설정 오류	설치 스크립트의 파라미터 확인
대기 중	리소스 부족	노드에 충분한 CPU/메모리 확보

에이전트 재설치

기존 에이전트를 제거하고 재설치합니다:

# 1. 기존 Agent 제거
kubectl delete namespace skuber-system

# 2. 네임스페이스 삭제 확인
kubectl get namespace skuber-system

# 3. 재설치
# Console에서 설치 스크립트를 다시 복사하여 실행

연결 문제

클러스터 상태가 DISCONNECTED

원인 1: 에이전트 Pod 다운

kubectl get pods -n skuber-system
# → Pod가 Running이 아니면 Agent 문제

원인 2: 네트워크 차단

# Agent에서 API 서버 접근 확인
kubectl exec -n skuber-system <agent-pod> -- curl -s https://api.skuberplus.com/health

원인 3: 인증 오류

# Agent 로그에서 인증 관련 오류 확인
kubectl logs -n skuber-system -l app=skuber-agent --tail=100 | grep -i "auth\|token\|unauthorized"

비용 데이터 문제

비용이 $0으로 표시됨

에이전트 연결 후 최대 1일 대기 (데이터 수집 및 비용 산출 소요)
클러스터 상태가 연결됨인지 확인
노드 인스턴스 가격 정보가 수집되었는지 확인

비용이 비정상적으로 높거나 낮음

노드 수가 실제와 일치하는지 확인 (Sync 버튼 클릭)
Custom Instance 타입의 가격이 정확한지 확인

최적화 문제

VPA 권장값이 표시되지 않음

워크로드 목록에서 해당 워크로드의 VPA 상태가 **적용 가능(Applicable)**인지 확인
에이전트 설치 후 최소 5분 대기 필요 (데이터 수집 기간)

제로 스케일링 후 Pod가 스케일 업되지 않음

에이전트 Pod 상태 확인
서비스의 Endpoints 확인
Ingress/Service가 정상 구성되어 있는지 확인

# Endpoints 확인
kubectl get endpoints <service-name> -n <namespace>

# Service 확인
kubectl describe service <service-name> -n <namespace>

노드 스케줄 실행 실패

히스토리에서 실패 원인 확인
노드 정책 설정이 유효한지 확인
클라우드 API 권한 확인 (노드 추가/삭제 권한)

Agent 제거

에이전트 제거는 반드시 Console UI의 클러스터 관리에서 클러스터 삭제를 통해 진행하세요.

⚠️ 주의: UI를 통해 클러스터를 삭제하지 않고 kubectl delete namespace skuber-system으로 강제 삭제하면 정상적으로 제거가 진행되지 않습니다. 반드시 Console에서 삭제하세요.

추가 지원

문제가 해결되지 않으면 지원팀에 문의하세요.

기술 지원: support@skuberplus.com