
Saneops ist eine selbst gehostete AIOps-Plattform, die Alarme von Grafana, Datadog und PagerDuty korreliert und dedupliziert, mit LLMs erste RCA-Entwürfe erstellt und das Alarmvolumen, das Menschen erreicht, um ~80% reduziert.
NOC- und Bereitschaftsdienste
Reduziert das Alarmaufkommen für Menschen um etwa 80 %, sodass L1-Ingenieure nicht mehr nur „Bestätigen“ klicken, sondern Probleme beheben.
Multi-Quellen-Alarmkorrelation
Fasst zusammenhängende Symptome von Diensten wie payment-api und checkout-worker zu einem einzigen Vorfall zusammen und eliminiert Duplikate aus mehreren Überwachungstools.
Ursachenanalyse
Erstellt innerhalb von Sekunden automatisch erste RCAs (z. B. „fehlender Index auf users.email nach Migration“) und beschleunigt so die Triage.
Incident-Management für SRE-Teams
Bietet ein Live-Dashboard mit korrelierten, offenen und aktiven Vorfällen, einschließlich Schweregraden (P1, P2, P3).
Selbst gehostete Compliance
Wird über ein Docker-Image vor Ort bereitgestellt und erfüllt die Datenschutzanforderungen von DPDP/GDPR.
Beta-Test für LLM-gestützte RCA
Geschlossene Beta mit 10 Designpartnern, 60 Tage kostenlos für Early Adopters.
Alarmkorrelation und Deduplizierung
Gruppiert automatisch 47 Alarme aus mehreren Quellen in einen Vorfall und reduziert so das Rauschen in Beta-Mandanten um etwa 92 %.
LLM-erstellte Ursachenanalyse (RCA)
Nutzt Claude, um Telemetriedaten über Dienste hinweg zu analysieren und eine Zusammenfassung der Ursache zu erstellen (z. B. „Abfrage-p99 ↑ 14× seit 02:41 UTC“).
Multi-Quellen-Webhook-Integration
Unterstützt Grafana, Datadog, PagerDuty, Prometheus und benutzerdefinierte JSON-Alarmquellen per Webhook.
Selbst gehosteter Betrieb
Läuft als Docker-Image und gibt Teams die volle Kontrolle über Daten und Compliance.
Live-Incident-Dashboard
Zeigt Echtzeitmetriken wie erfasste Alarme, Gesamtzahl der Vorfälle, offene Vorfälle und aktive Vorfälle mit Schweregraden an.
~80 % Rauschunterdrückung
Reduziert das Alarmaufkommen für Menschen; interne Tests bestätigen die Verarbeitung von über 10.000 Alarmen pro Tag.
< 1 Minute L1-Triage-Zeit
Automatisch gesammelter Kontext ermöglicht schnellere Erstreaktionen und verkürzt die MTTR um das Vierfache.
Keine Fehlalarme
Nur tatsächlich relevante Vorfälle alarmieren die Bereitschaftsingenieure, sodass Fehlalarme entfallen.
Saneops ist eine selbst gehostete AIOps-Plattform, die Alarme von Grafana, Datadog und PagerDuty korreliert und dedupliziert, mit LLMs erste RCA-Entwürfe erstellt und das Alarmvolumen, das Menschen erreicht, um ~80% reduziert.
Kategorie: Automation
Link: https://saneops.in/
Tags: Self-hosted AIOps, Alert-Korrelation, RCA-Generierung, Incident-Management, Observability