Función
Alertas
Reglas threshold + anomaly, enrutado por severidad, silences, ventanas de mantenimiento.
Un evaluador sin estado se ejecuta cada 30 segundos, evalúa todas las reglas y deduplica incidentes por fingerprint (rule_id + labels de muestra). La máquina de estados pending → firing → resolved elimina el flapping. Webhooks firmados, Slack, Telegram, email. Una cola de reintentos con backoff 30s / 2m / 10m. Enrutado por severidad con cadena de fallback.
Propiedades clave
- ✓Reglas threshold + detección de anomalías (avg + σ stddev)
- ✓Expresiones PromQL; la reescritura AST inyecta organization_id
- ✓Enrutado por severidad: critical y warning por canales distintos
- ✓Silences (ad-hoc) + ventanas de mantenimiento (RRULE)
- ✓Webhooks firmados con HMAC y timestamp ±5min