주요 기능

Skuber+ Observability는 Kubernetes 환경을 위한 통합 관측성 플랫폼으로, 다양한 기능을 제공합니다.

기능 개요

카테고리	기능	설명
시각화	서비스 맵	서비스 토폴로지 및 의존성 시각화
수집	로그 관리	중앙 집중식 로그 수집 및 검색
수집	메트릭 모니터링	인프라 및 애플리케이션 메트릭
수집	분산 트레이싱	요청 추적 및 지연시간 분석
분석	APM	애플리케이션 성능 모니터링
분석	인프라 모니터링	노드/파드/컨테이너 리소스
운영	알림	임계치 기반 알림 설정
운영	대시보드	커스텀 대시보드 생성
추적	예외 모니터링	애플리케이션 예외 추적

서비스 맵

서비스 간 의존성과 트래픽 흐름을 토폴로지 그래프로 시각화합니다.

주요 기능

서비스 토폴로지 시각화: 마이크로서비스 간 호출 관계를 노드와 엣지로 표현
실시간 메트릭 오버레이: 각 연결의 처리량, 지연시간, 에러율 표시
프로토콜별 분류: HTTP, gRPC, Redis, SQL, Kafka 등 프로토콜 구분
클러스터/네임스페이스 필터링: 원하는 범위로 토폴로지 필터링
호버 정보: 노드 또는 엣지에 마우스를 올리면 상세 메트릭 표시
상세 정보 패널: 선택한 서비스 또는 연결의 상세 정보 확인

메트릭 정보

메트릭	설명
Throughput	초당 요청 수 (req/s)
Latency P50/P95/P99	지연시간 백분위수 (ms)
Error Rate	에러 비율 (%)
Bytes	전송된 데이터량

로그 관리

모든 파드의 로그를 중앙에서 수집하고 검색합니다.

주요 기능

자동 로그 수집: OTel Collector가 모든 파드 로그를 자동 수집
구조화된 로그 파싱: JSON, 키-값 형식 등 자동 파싱
강력한 검색: 풀텍스트 검색 및 필터 쿼리
로그 속성 필터링: 클러스터, 네임스페이스, 서비스, 레벨별 필터
실시간 테일링: 실시간 로그 스트림 확인
로그 → 트레이스 연결: 트레이스 ID를 통해 관련 트레이스로 이동

쿼리 예시

level:error AND service.name:payment-service

메트릭 모니터링

인프라 및 애플리케이션 메트릭을 수집하고 시각화합니다.

수집 메트릭 종류

인프라 메트릭:

CPU, 메모리, 디스크 사용량
네트워크 I/O
컨테이너 리소스 사용량

Kubernetes 메트릭:

노드 상태 (Ready, NotReady, SchedulingDisabled)
파드 상태 (Running, Pending, Failed)
Deployment/StatefulSet/DaemonSet 상태

애플리케이션 메트릭:

RED 메트릭 (Rate, Errors, Duration)
커스텀 메트릭 (Prometheus 형식)

주요 기능

쿼리 빌더: UI에서 메트릭 쿼리 작성
수식 지원: 여러 메트릭 조합 및 계산
다양한 시각화: 라인, 바, 게이지, 테이블 등

분산 트레이싱

마이크로서비스 환경에서 요청의 전체 경로를 추적합니다.

주요 기능

Flamegraph: 스팬 계층을 불꽃 그래프로 시각화
Gantt Chart: 스팬 타임라인을 간트 차트로 표시
스팬 상세 정보: 각 스팬의 속성, 이벤트, 로그 확인
에러 추적: 에러가 발생한 스팬 하이라이트
서비스별 필터링: 특정 서비스의 트레이스만 조회

자동 계측

APM Agent를 통해 코드 변경 없이 다음 프로토콜의 트레이스를 자동 수집합니다:

HTTP/HTTPS
gRPC
SQL (MySQL, PostgreSQL)
Redis
Kafka

APM (Application Performance Monitoring)

애플리케이션 성능을 모니터링하고 분석합니다.

핵심 메트릭

메트릭	설명
P99 Latency	99번째 백분위수 응답 시간
Error Rate	에러 응답 비율
Request Rate	초당 요청 수
Apdex	애플리케이션 성능 지수

주요 기능

서비스 목록: 모든 서비스의 핵심 메트릭 한눈에 확인
서비스 상세: 개별 서비스의 상세 성능 분석
엔드포인트 분석: API 엔드포인트별 성능 비교
외부 호출 분석: 데이터베이스, 외부 API 호출 추적

인프라 모니터링

Kubernetes 클러스터의 인프라 상태를 모니터링합니다.

모니터링 대상

노드:

CPU, 메모리, 디스크 사용량
네트워크 I/O
노드 상태 (Ready, NotReady)

파드:

컨테이너 리소스 사용량
재시작 횟수
파드 상태

볼륨:

PV/PVC 사용량
스토리지 용량

알림

임계치를 설정하고 조건 충족 시 알림을 받습니다.

알림 유형

데이터 소스	설명
메트릭 알림	메트릭 임계치 기반 알림
로그 알림	특정 로그 패턴 감지 시 알림
트레이스 알림	트레이스 기반 알림 (지연시간, 에러)

알림 채널

Email
Slack
Webhook
PagerDuty
Opsgenie

주요 기능

알림 규칙 관리: 조건, 임계치, 심각도 설정
알림 히스토리: 과거 알림 기록 조회
음소거 규칙: 특정 시간 또는 조건에서 알림 억제

대시보드

커스텀 대시보드를 생성하여 원하는 메트릭을 시각화합니다.

패널 유형

시계열 차트 (Time Series)
바 차트 (Bar Chart)
파이 차트 (Pie Chart)
테이블 (Table)
게이지 (Gauge)
스탯 (Stat)

주요 기능

대시보드 템플릿: 미리 정의된 대시보드 활용
변수 지원: 클러스터, 네임스페이스 등 변수로 필터링
대시보드 공유: JSON 형식으로 내보내기/가져오기

예외 모니터링

애플리케이션에서 발생하는 예외를 추적합니다.

주요 기능

자동 예외 캡처: Java, Python, Ruby, JavaScript 자동 캡처
스택 트레이스: 상세 스택 트레이스 확인
예외 그룹핑: 동일 예외 자동 그룹화
커스텀 속성: 사용자 ID 등 추가 컨텍스트 연결

멀티클러스터 지원

모든 기능에서 멀티클러스터를 지원합니다.

클러스터 필터링

모든 화면에서 클러스터 필터를 통해 특정 클러스터의 데이터만 조회할 수 있습니다:

서비스 맵: 클러스터별 토폴로지
로그: 클러스터별 로그 검색
메트릭: 클러스터별 메트릭 대시보드
트레이스: 클러스터별 트레이스 조회
알림: 클러스터별 알림 규칙

클러스터 식별

각 Agent Cluster에서 수집된 데이터에는 자동으로 k8s.cluster.name 속성이 추가되어 클러스터를 식별합니다.

다음 단계

서비스 맵 - 서비스 맵 상세 가이드
Agent 클러스터 설치 - 모니터링 대상 클러스터 설치