Función

Alertas

Reglas threshold + anomaly, enrutado por severidad, silences, ventanas de mantenimiento.

Un evaluador sin estado se ejecuta cada 30 segundos, evalúa todas las reglas y deduplica incidentes por fingerprint (rule_id + labels de muestra). La máquina de estados pending → firing → resolved elimina el flapping. Webhooks firmados, Slack, Telegram, email. Una cola de reintentos con backoff 30s / 2m / 10m. Enrutado por severidad con cadena de fallback.

Propiedades clave

  • Reglas threshold + detección de anomalías (avg + σ stddev)
  • Expresiones PromQL; la reescritura AST inyecta organization_id
  • Enrutado por severidad: critical y warning por canales distintos
  • Silences (ad-hoc) + ventanas de mantenimiento (RRULE)
  • Webhooks firmados con HMAC y timestamp ±5min

Funciones relacionadas