Funktion

Alerts

Threshold- + Anomaly-Regeln, Routing pro Severity, Silences, Maintenance-Windows.

Ein zustandsloser Evaluator tickt alle 30 Sekunden, wertet alle Regeln aus und dedupliziert Incidents per Fingerprint (rule_id + Sample-Labels). Die State-Machine pending → firing → resolved verhindert Flapping. Signierte Webhooks, Slack, Telegram, E-Mail. Eine Retry-Queue mit 30s / 2m / 10m Backoff. Routing pro Severity mit Fallback-Chain.

Kerneigenschaften

  • Threshold-Regeln + Anomaly Detection (avg + σ stddev)
  • PromQL-Ausdrücke; AST-Rewrite injiziert organization_id
  • Routing pro Severity: critical und warning über verschiedene Kanäle
  • Silences (ad-hoc) + Maintenance-Windows (RRULE)
  • HMAC-signierte Webhooks mit ±5min Timestamp

Verwandte Funktionen