주요 기능
최종 수정: 2026. 1. 16.
주요 기능
Skuber+ Observability는 Kubernetes 환경을 위한 통합 관측성 플랫폼으로, 다양한 기능을 제공합니다.
기능 개요
| 카테고리 | 기능 | 설명 |
|---|---|---|
| 시각화 | 서비스 맵 | 서비스 토폴로지 및 의존성 시각화 |
| 수집 | 로그 관리 | 중앙 집중식 로그 수집 및 검색 |
| 수집 | 메트릭 모니터링 | 인프라 및 애플리케이션 메트릭 |
| 수집 | 분산 트레이싱 | 요청 추적 및 지연시간 분석 |
| 분석 | APM | 애플리케이션 성능 모니터링 |
| 분석 | 인프라 모니터링 | 노드/파드/컨테이너 리소스 |
| 운영 | 알림 | 임계치 기반 알림 설정 |
| 운영 | 대시보드 | 커스텀 대시보드 생성 |
| 추적 | 예외 모니터링 | 애플리케이션 예외 추적 |
서비스 맵
서비스 간 의존성과 트래픽 흐름을 토폴로지 그래프로 시각화합니다.
주요 기능
- 서비스 토폴로지 시각화: 마이크로서비스 간 호출 관계를 노드와 엣지로 표현
- 실시간 메트릭 오버레이: 각 연결의 처리량, 지연시간, 에러율 표시
- 프로토콜별 분류: HTTP, gRPC, Redis, SQL, Kafka 등 프로토콜 구분
- 클러스터/네임스페이스 필터링: 원하는 범위로 토폴로지 필터링
- 호버 정보: 노드 또는 엣지에 마우스를 올리면 상세 메트릭 표시
- 상세 정보 패널: 선택한 서비스 또는 연결의 상세 정보 확인
메트릭 정보
| 메트릭 | 설명 |
|---|---|
| Throughput | 초당 요청 수 (req/s) |
| Latency P50/P95/P99 | 지연시간 백분위수 (ms) |
| Error Rate | 에러 비율 (%) |
| Bytes | 전송된 데이터량 |
로그 관리
모든 파드의 로그를 중앙에서 수집하고 검색합니다.
주요 기능
- 자동 로그 수집: OTel Collector가 모든 파드 로그를 자동 수집
- 구조화된 로그 파싱: JSON, 키-값 형식 등 자동 파싱
- 강력한 검색: 풀텍스트 검색 및 필터 쿼리
- 로그 속성 필터링: 클러스터, 네임스페이스, 서비스, 레벨별 필터
- 실시간 테일링: 실시간 로그 스트림 확인
- 로그 → 트레이스 연결: 트레이스 ID를 통해 관련 트레이스로 이동
쿼리 예시
level:error AND service.name:payment-service메트릭 모니터링
인프라 및 애플리케이션 메트릭을 수집하고 시각화합니다.
수집 메트릭 종류
인프라 메트릭:
- CPU, 메모리, 디스크 사용량
- 네트워크 I/O
- 컨테이너 리소스 사용량
Kubernetes 메트릭:
- 노드 상태 (Ready, NotReady, SchedulingDisabled)
- 파드 상태 (Running, Pending, Failed)
- Deployment/StatefulSet/DaemonSet 상태
애플리케이션 메트릭:
- RED 메트릭 (Rate, Errors, Duration)
- 커스텀 메트릭 (Prometheus 형식)
주요 기능
- 쿼리 빌더: UI에서 메트릭 쿼리 작성
- 수식 지원: 여러 메트릭 조합 및 계산
- 다양한 시각화: 라인, 바, 게이지, 테이블 등
분산 트레이싱
마이크로서비스 환경에서 요청의 전체 경로를 추적합니다.
주요 기능
- Flamegraph: 스팬 계층을 불꽃 그래프로 시각화
- Gantt Chart: 스팬 타임라인을 간트 차트로 표시
- 스팬 상세 정보: 각 스팬의 속성, 이벤트, 로그 확인
- 에러 추적: 에러가 발생한 스팬 하이라이트
- 서비스별 필터링: 특정 서비스의 트레이스만 조회
자동 계측
APM Agent를 통해 코드 변경 없이 다음 프로토콜의 트레이스를 자동 수집합니다:
- HTTP/HTTPS
- gRPC
- SQL (MySQL, PostgreSQL)
- Redis
- Kafka
APM (Application Performance Monitoring)
애플리케이션 성능을 모니터링하고 분석합니다.
핵심 메트릭
| 메트릭 | 설명 |
|---|---|
| P99 Latency | 99번째 백분위수 응답 시간 |
| Error Rate | 에러 응답 비율 |
| Request Rate | 초당 요청 수 |
| Apdex | 애플리케이션 성능 지수 |
주요 기능
- 서비스 목록: 모든 서비스의 핵심 메트릭 한눈에 확인
- 서비스 상세: 개별 서비스의 상세 성능 분석
- 엔드포인트 분석: API 엔드포인트별 성능 비교
- 외부 호출 분석: 데이터베이스, 외부 API 호출 추적
인프라 모니터링
Kubernetes 클러스터의 인프라 상태를 모니터링합니다.
모니터링 대상
노드:
- CPU, 메모리, 디스크 사용량
- 네트워크 I/O
- 노드 상태 (Ready, NotReady)
파드:
- 컨테이너 리소스 사용량
- 재시작 횟수
- 파드 상태
볼륨:
- PV/PVC 사용량
- 스토리지 용량
알림
임계치를 설정하고 조건 충족 시 알림을 받습니다.
알림 유형
| 데이터 소스 | 설명 |
|---|---|
| 메트릭 알림 | 메트릭 임계치 기반 알림 |
| 로그 알림 | 특정 로그 패턴 감지 시 알림 |
| 트레이스 알림 | 트레이스 기반 알림 (지연시간, 에러) |
알림 채널
- Slack
- Webhook
- PagerDuty
- Opsgenie
주요 기능
- 알림 규칙 관리: 조건, 임계치, 심각도 설정
- 알림 히스토리: 과거 알림 기록 조회
- 음소거 규칙: 특정 시간 또는 조건에서 알림 억제
대시보드
커스텀 대시보드를 생성하여 원하는 메트릭을 시각화합니다.
패널 유형
- 시계열 차트 (Time Series)
- 바 차트 (Bar Chart)
- 파이 차트 (Pie Chart)
- 테이블 (Table)
- 게이지 (Gauge)
- 스탯 (Stat)
주요 기능
- 대시보드 템플릿: 미리 정의된 대시보드 활용
- 변수 지원: 클러스터, 네임스페이스 등 변수로 필터링
- 대시보드 공유: JSON 형식으로 내보내기/가져오기
예외 모니터링
애플리케이션에서 발생하는 예외를 추적합니다.
주요 기능
- 자동 예외 캡처: Java, Python, Ruby, JavaScript 자동 캡처
- 스택 트레이스: 상세 스택 트레이스 확인
- 예외 그룹핑: 동일 예외 자동 그룹화
- 커스텀 속성: 사용자 ID 등 추가 컨텍스트 연결
멀티클러스터 지원
모든 기능에서 멀티클러스터를 지원합니다.
클러스터 필터링
모든 화면에서 클러스터 필터를 통해 특정 클러스터의 데이터만 조회할 수 있습니다:
- 서비스 맵: 클러스터별 토폴로지
- 로그: 클러스터별 로그 검색
- 메트릭: 클러스터별 메트릭 대시보드
- 트레이스: 클러스터별 트레이스 조회
- 알림: 클러스터별 알림 규칙
클러스터 식별
각 Agent Cluster에서 수집된 데이터에는 자동으로 k8s.cluster.name 속성이 추가되어 클러스터를 식별합니다.
다음 단계
- 서비스 맵 - 서비스 맵 상세 가이드
- Agent 클러스터 설치 - 모니터링 대상 클러스터 설치