infra-observability-stack-review
CommunityDesign LGTM observability with SLOs
Authorivanshamaev
Version1.0.0
Installs0
System Documentation
What problem does it solve?
Обеспечивает аудит и проектирование observability-стека для data platform так, чтобы метрики, логи и трассировки работали согласованно, имели управляемую кардинальность и поддерживали SLO вместо “пороговых” алертов.
Core Features & Use Cases
- Three-pillar architecture (metrics/logs/traces): проектирует сквозной контур наблюдаемости с единым сборщиком через OpenTelemetry Collector и унифицированной визуализацией в Grafana.
- LGTM stack setup (Loki + Grafana + Tempo + Prometheus/Mimir): описывает связку для long-term metrics, лог-агрегации и distributed tracing.
- Cardinality management + structured logs: задаёт подходы к предотвращению взрыва series и рекомендацию по JSON-логированию с полями вроде dag_id/task_id/level.
- SLO & error-budget tracking: помогает определить SLO, индикаторы и burn-rate алерты (например, через Pyrra), а также контролировать pipeline freshness/throughput/error rate.
- Observability as Code (Grafana provisioning): автоматизирует публикацию дашбордов и алертов через Kubernetes-конфиги.
- Use Case: при запуске новой платформы данных или при разборе production-инцидента, когда “ничего не видно”, но нужно быстро закрыть gaps по метрикам, логам и трассам.
Quick Start
Use this skill to audit your current monitoring and design an LGTM + OpenTelemetry + SLO-based observability plan that prevents high-cardinality issues and enables pipeline freshness, throughput, and error-rate dashboards and alerts.
Dependency Matrix
Required Modules
None requiredComponents
references
💻 Claude Code Installation
Recommended: Let Claude install automatically. Simply copy and paste the text below to Claude Code.
Please help me install this Skill: Name: infra-observability-stack-review Download link: https://github.com/ivanshamaev/de-agent-skills/archive/main.zip#infra-observability-stack-review Please download this .zip file, extract it, and install it in the .claude/skills/ directory.
Agent Skills Search Helper
Install a tiny helper to your Agent, search and equip skill from 471,000+ vetted skills library on demand.