Возможность
Алерты
Threshold + anomaly правила, per-severity routing, silences, maintenance windows.
Stateless evaluator тикает каждые 30 секунд, оценивает все правила, дедуплицирует инциденты по fingerprint (rule_id + sample labels). State machine pending → firing → resolved исключает flapping. Подписанные webhook-и, Slack, Telegram, email. Retry-очередь с backoff 30s / 2m / 10m. Per-severity routing с fallback chain.
Ключевые свойства
- ✓Threshold-правила + anomaly detection (avg + σ stddev)
- ✓PromQL-выражения, AST-rewrite инжектит organization_id
- ✓Per-severity routing: critical и warning по разным каналам
- ✓Silences (ad-hoc) + maintenance windows (RRULE)
- ✓HMAC-подписанные webhook-и с timestamp ±5min