주요 기능

최종 수정: 2026. 1. 16.

주요 기능

Skuber+ Observability는 Kubernetes 환경을 위한 통합 관측성 플랫폼으로, 다양한 기능을 제공합니다.


기능 개요

카테고리 기능 설명
시각화 서비스 맵 서비스 토폴로지 및 의존성 시각화
수집 로그 관리 중앙 집중식 로그 수집 및 검색
수집 메트릭 모니터링 인프라 및 애플리케이션 메트릭
수집 분산 트레이싱 요청 추적 및 지연시간 분석
분석 APM 애플리케이션 성능 모니터링
분석 인프라 모니터링 노드/파드/컨테이너 리소스
운영 알림 임계치 기반 알림 설정
운영 대시보드 커스텀 대시보드 생성
추적 예외 모니터링 애플리케이션 예외 추적

서비스 맵

서비스 간 의존성과 트래픽 흐름을 토폴로지 그래프로 시각화합니다.

주요 기능

  • 서비스 토폴로지 시각화: 마이크로서비스 간 호출 관계를 노드와 엣지로 표현
  • 실시간 메트릭 오버레이: 각 연결의 처리량, 지연시간, 에러율 표시
  • 프로토콜별 분류: HTTP, gRPC, Redis, SQL, Kafka 등 프로토콜 구분
  • 클러스터/네임스페이스 필터링: 원하는 범위로 토폴로지 필터링
  • 호버 정보: 노드 또는 엣지에 마우스를 올리면 상세 메트릭 표시
  • 상세 정보 패널: 선택한 서비스 또는 연결의 상세 정보 확인

메트릭 정보

메트릭 설명
Throughput 초당 요청 수 (req/s)
Latency P50/P95/P99 지연시간 백분위수 (ms)
Error Rate 에러 비율 (%)
Bytes 전송된 데이터량

로그 관리

모든 파드의 로그를 중앙에서 수집하고 검색합니다.

주요 기능

  • 자동 로그 수집: OTel Collector가 모든 파드 로그를 자동 수집
  • 구조화된 로그 파싱: JSON, 키-값 형식 등 자동 파싱
  • 강력한 검색: 풀텍스트 검색 및 필터 쿼리
  • 로그 속성 필터링: 클러스터, 네임스페이스, 서비스, 레벨별 필터
  • 실시간 테일링: 실시간 로그 스트림 확인
  • 로그 → 트레이스 연결: 트레이스 ID를 통해 관련 트레이스로 이동

쿼리 예시

level:error AND service.name:payment-service

메트릭 모니터링

인프라 및 애플리케이션 메트릭을 수집하고 시각화합니다.

수집 메트릭 종류

인프라 메트릭:

  • CPU, 메모리, 디스크 사용량
  • 네트워크 I/O
  • 컨테이너 리소스 사용량

Kubernetes 메트릭:

  • 노드 상태 (Ready, NotReady, SchedulingDisabled)
  • 파드 상태 (Running, Pending, Failed)
  • Deployment/StatefulSet/DaemonSet 상태

애플리케이션 메트릭:

  • RED 메트릭 (Rate, Errors, Duration)
  • 커스텀 메트릭 (Prometheus 형식)

주요 기능

  • 쿼리 빌더: UI에서 메트릭 쿼리 작성
  • 수식 지원: 여러 메트릭 조합 및 계산
  • 다양한 시각화: 라인, 바, 게이지, 테이블 등

분산 트레이싱

마이크로서비스 환경에서 요청의 전체 경로를 추적합니다.

주요 기능

  • Flamegraph: 스팬 계층을 불꽃 그래프로 시각화
  • Gantt Chart: 스팬 타임라인을 간트 차트로 표시
  • 스팬 상세 정보: 각 스팬의 속성, 이벤트, 로그 확인
  • 에러 추적: 에러가 발생한 스팬 하이라이트
  • 서비스별 필터링: 특정 서비스의 트레이스만 조회

자동 계측

APM Agent를 통해 코드 변경 없이 다음 프로토콜의 트레이스를 자동 수집합니다:

  • HTTP/HTTPS
  • gRPC
  • SQL (MySQL, PostgreSQL)
  • Redis
  • Kafka

APM (Application Performance Monitoring)

애플리케이션 성능을 모니터링하고 분석합니다.

핵심 메트릭

메트릭 설명
P99 Latency 99번째 백분위수 응답 시간
Error Rate 에러 응답 비율
Request Rate 초당 요청 수
Apdex 애플리케이션 성능 지수

주요 기능

  • 서비스 목록: 모든 서비스의 핵심 메트릭 한눈에 확인
  • 서비스 상세: 개별 서비스의 상세 성능 분석
  • 엔드포인트 분석: API 엔드포인트별 성능 비교
  • 외부 호출 분석: 데이터베이스, 외부 API 호출 추적

인프라 모니터링

Kubernetes 클러스터의 인프라 상태를 모니터링합니다.

모니터링 대상

노드:

  • CPU, 메모리, 디스크 사용량
  • 네트워크 I/O
  • 노드 상태 (Ready, NotReady)

파드:

  • 컨테이너 리소스 사용량
  • 재시작 횟수
  • 파드 상태

볼륨:

  • PV/PVC 사용량
  • 스토리지 용량

알림

임계치를 설정하고 조건 충족 시 알림을 받습니다.

알림 유형

데이터 소스 설명
메트릭 알림 메트릭 임계치 기반 알림
로그 알림 특정 로그 패턴 감지 시 알림
트레이스 알림 트레이스 기반 알림 (지연시간, 에러)

알림 채널

  • Email
  • Slack
  • Webhook
  • PagerDuty
  • Opsgenie

주요 기능

  • 알림 규칙 관리: 조건, 임계치, 심각도 설정
  • 알림 히스토리: 과거 알림 기록 조회
  • 음소거 규칙: 특정 시간 또는 조건에서 알림 억제

대시보드

커스텀 대시보드를 생성하여 원하는 메트릭을 시각화합니다.

패널 유형

  • 시계열 차트 (Time Series)
  • 바 차트 (Bar Chart)
  • 파이 차트 (Pie Chart)
  • 테이블 (Table)
  • 게이지 (Gauge)
  • 스탯 (Stat)

주요 기능

  • 대시보드 템플릿: 미리 정의된 대시보드 활용
  • 변수 지원: 클러스터, 네임스페이스 등 변수로 필터링
  • 대시보드 공유: JSON 형식으로 내보내기/가져오기

예외 모니터링

애플리케이션에서 발생하는 예외를 추적합니다.

주요 기능

  • 자동 예외 캡처: Java, Python, Ruby, JavaScript 자동 캡처
  • 스택 트레이스: 상세 스택 트레이스 확인
  • 예외 그룹핑: 동일 예외 자동 그룹화
  • 커스텀 속성: 사용자 ID 등 추가 컨텍스트 연결

멀티클러스터 지원

모든 기능에서 멀티클러스터를 지원합니다.

클러스터 필터링

모든 화면에서 클러스터 필터를 통해 특정 클러스터의 데이터만 조회할 수 있습니다:

  • 서비스 맵: 클러스터별 토폴로지
  • 로그: 클러스터별 로그 검색
  • 메트릭: 클러스터별 메트릭 대시보드
  • 트레이스: 클러스터별 트레이스 조회
  • 알림: 클러스터별 알림 규칙

클러스터 식별

각 Agent Cluster에서 수집된 데이터에는 자동으로 k8s.cluster.name 속성이 추가되어 클러스터를 식별합니다.


다음 단계

  • 서비스 맵 - 서비스 맵 상세 가이드
  • Agent 클러스터 설치 - 모니터링 대상 클러스터 설치