용어집

최종 수정: 2026. 1. 16.

용어집

Skuber+ Observability에서 사용되는 주요 용어를 정의합니다.


A

Agent Cluster (에이전트 클러스터)

모니터링 대상이 되는 Kubernetes 클러스터. 데이터 수집 에이전트(OTel Collector, APM Agent)가 설치되어 Host 클러스터로 데이터를 전송합니다.

Alert (알림)

특정 조건이 충족될 때 발생하는 통지. 메트릭 임계값, 로그 패턴, 에러율 등을 기반으로 설정할 수 있습니다.

APM (Application Performance Monitoring)

애플리케이션 성능 모니터링. 서비스의 응답 시간, 처리량, 에러율 등을 추적합니다.

APM Agent

eBPF 기반 자동 계측 에이전트. 코드 변경 없이 HTTP, gRPC 등의 요청을 자동으로 계측합니다.

Attribute (속성)

트레이스, 메트릭, 로그에 첨부되는 키-값 쌍의 메타데이터. 예: service.name, http.method.


B

Batch Processor (배치 프로세서)

OTel Collector에서 데이터를 모아 일괄 전송하는 컴포넌트. 네트워크 효율성을 높입니다.

BTF (BPF Type Format)

eBPF 프로그램이 커널 데이터 구조에 접근하기 위한 메타데이터 형식. APM Agent 실행에 필요합니다.


C

Cardinality (카디널리티)

고유한 시계열 조합의 수. 높은 카디널리티는 저장소와 쿼리 성능에 영향을 줍니다.

ClickHouse

고성능 컬럼형 데이터베이스. 메트릭, 로그, 트레이스 데이터를 저장합니다.

Context Propagation (컨텍스트 전파)

분산 시스템에서 트레이스 컨텍스트를 서비스 간에 전달하는 메커니즘.


D

DaemonSet

Kubernetes에서 모든 노드에 파드를 배포하는 방식. OTel Collector와 APM Agent가 DaemonSet으로 배포됩니다.

Dashboard (대시보드)

메트릭과 로그를 시각화하는 화면. 여러 패널을 조합하여 구성합니다.

Duration (지속시간)

요청 또는 작업을 완료하는 데 걸린 시간. RED 메트릭의 하나입니다.


E

eBPF (Extended Berkeley Packet Filter)

Linux 커널에서 안전하게 코드를 실행할 수 있는 기술. APM Agent가 eBPF를 사용하여 네트워크 트래픽을 감지합니다.

Error Rate (에러율)

전체 요청 중 에러 응답의 비율. RED 메트릭의 하나입니다.

Exporter

OTel Collector에서 데이터를 외부 시스템으로 전송하는 컴포넌트.


G

Gauge (게이지)

현재 값을 나타내는 메트릭 유형. 예: 현재 메모리 사용량, 활성 연결 수.

gRPC

Google에서 개발한 고성능 RPC 프레임워크. OTLP 전송에 사용됩니다.


H

Histogram (히스토그램)

값의 분포를 나타내는 메트릭 유형. 백분위수 계산에 사용됩니다.

Host Cluster (호스트 클러스터)

Skuber+ Observability의 중앙 서버가 설치되는 Kubernetes 클러스터. UI, 쿼리 서비스, 데이터베이스가 포함됩니다.


I

Instrumentation (계측)

애플리케이션에서 관측 데이터를 생성하는 과정. 자동 계측과 수동 계측이 있습니다.


K

kube-state-metrics

Kubernetes 오브젝트 상태를 메트릭으로 노출하는 서비스. Deployment 레플리카 수, Pod 상태 등.

Kubeletstats

Kubelet에서 노드 및 파드 리소스 메트릭을 수집하는 OTel Collector 리시버.


L

Label (레이블)

메트릭에 첨부되는 키-값 쌍. 필터링과 집계에 사용됩니다.

Latency (지연시간)

요청에서 응답까지 걸리는 시간. P50, P95, P99 등 백분위수로 측정합니다.

Live Tail

실시간으로 로그를 스트리밍하여 보는 기능.


M

Metric (메트릭)

시간에 따른 수치 데이터. CPU 사용률, 요청 수, 에러율 등.

MV (Materialized View)

ClickHouse에서 데이터를 자동으로 집계하여 저장하는 뷰.


O

Observability (관측성)

시스템의 외부 출력(메트릭, 로그, 트레이스)을 통해 내부 상태를 이해하는 능력.

OpenTelemetry (OTel)

관측 데이터 수집을 위한 오픈소스 표준. API, SDK, Collector를 제공합니다.

OTel Collector

OpenTelemetry Collector. 데이터를 수신, 처리, 전송하는 에이전트.

OTLP (OpenTelemetry Protocol)

OpenTelemetry 데이터 전송을 위한 프로토콜. gRPC와 HTTP를 지원합니다.


P

P50, P95, P99 (백분위수)

데이터 분포에서 특정 비율 이하의 값. P99는 99%의 요청이 해당 시간 이내에 완료됨을 의미합니다.

Panel (패널)

대시보드의 개별 시각화 요소. 차트, 테이블, 게이지 등.

Processor (프로세서)

OTel Collector에서 데이터를 변환하거나 필터링하는 컴포넌트.

PromQL

Prometheus Query Language. 메트릭 쿼리에 사용됩니다.


R

Rate (속도)

단위 시간당 이벤트 수. RED 메트릭의 하나입니다.

Receiver (리시버)

OTel Collector에서 데이터를 수신하는 컴포넌트.

RED Metrics

Rate(속도), Errors(에러), Duration(지속시간). 서비스 모니터링의 핵심 지표.

Retention (보존 기간)

데이터를 저장하는 기간. TTL로 설정합니다.


S

Sampling (샘플링)

전체 데이터 중 일부만 수집하는 기술. 저장 비용과 성능을 위해 사용합니다.

SDK (Software Development Kit)

애플리케이션에서 계측을 구현하기 위한 라이브러리.

Service Map (서비스 맵)

서비스 간 의존성과 통신을 시각화한 토폴로지 다이어그램.

Span (스팬)

트레이스의 단위 작업. 시작 시간, 종료 시간, 속성을 포함합니다.

SLO (Service Level Objective)

서비스 수준 목표. 예: P99 지연시간 200ms 이하.


T

Tail Sampling

트레이스가 완료된 후 샘플링 결정을 내리는 방식. 에러나 느린 요청을 우선 수집할 수 있습니다.

Telemetry (텔레메트리)

시스템에서 생성되는 관측 데이터의 총칭.

Trace (트레이스)

분산 시스템에서 요청의 전체 경로. 여러 스팬으로 구성됩니다.

Trace ID

트레이스를 고유하게 식별하는 ID. 모든 관련 스팬이 동일한 Trace ID를 공유합니다.

TTL (Time To Live)

데이터 보존 기간. TTL이 지나면 데이터가 자동 삭제됩니다.


W

Workload (워크로드)

Kubernetes에서 실행되는 애플리케이션. Deployment, StatefulSet, DaemonSet 등.


다음 단계

  • 지원 플랫폼 - 지원 환경
  • 자주 묻는 질문 - 자주 묻는 질문