Funktion
Alerts
Threshold- + Anomaly-Regeln, Routing pro Severity, Silences, Maintenance-Windows.
Ein zustandsloser Evaluator tickt alle 30 Sekunden, wertet alle Regeln aus und dedupliziert Incidents per Fingerprint (rule_id + Sample-Labels). Die State-Machine pending → firing → resolved verhindert Flapping. Signierte Webhooks, Slack, Telegram, E-Mail. Eine Retry-Queue mit 30s / 2m / 10m Backoff. Routing pro Severity mit Fallback-Chain.
Kerneigenschaften
- ✓Threshold-Regeln + Anomaly Detection (avg + σ stddev)
- ✓PromQL-Ausdrücke; AST-Rewrite injiziert organization_id
- ✓Routing pro Severity: critical und warning über verschiedene Kanäle
- ✓Silences (ad-hoc) + Maintenance-Windows (RRULE)
- ✓HMAC-signierte Webhooks mit ±5min Timestamp