Возможность

Алерты

Threshold + anomaly правила, per-severity routing, silences, maintenance windows.

Stateless evaluator тикает каждые 30 секунд, оценивает все правила, дедуплицирует инциденты по fingerprint (rule_id + sample labels). State machine pending → firing → resolved исключает flapping. Подписанные webhook-и, Slack, Telegram, email. Retry-очередь с backoff 30s / 2m / 10m. Per-severity routing с fallback chain.

Ключевые свойства

  • Threshold-правила + anomaly detection (avg + σ stddev)
  • PromQL-выражения, AST-rewrite инжектит organization_id
  • Per-severity routing: critical и warning по разным каналам
  • Silences (ad-hoc) + maintenance windows (RRULE)
  • HMAC-подписанные webhook-и с timestamp ±5min

Связанные возможности