Product Launch2026-06-07TechCrunch AI

OpenAI führt Sperrmodus zur Abwehr von Prompt-Injection-Angriffen ein

OpenAI hat eine neue Sicherheitsfunktion namens Sperrmodus (Lockdown Mode) eingeführt, die sensible Daten vor Prompt-Injection-Angriffen in ChatGPT schützen soll. Die Funktion stellt einen bedeutenden Schritt dar, um wachsende Sicherheitsbedenken zu adressieren, da KI-Agenten zunehmend sensible Unternehmensdaten verarbeiten. Prompt-Injection-Angriffe treten auf, wenn böswillige Benutzer Eingaben erstellen, die KI-Modelle dazu verleiten, ihre Sicherheitsanweisungen zu ignorieren oder vertrauliche Informationen preiszugeben. Diese Angriffe sind zu einem großen Problem für Unternehmen geworden, die KI-Assistenten zur Verarbeitung von Kundendaten, internen Dokumenten oder proprietären Informationen einsetzen. Der Sperrmodus funktioniert, indem er das Verhalten des Modells auf einen vordefinierten Satz zulässiger Aktionen und Antworten beschränkt. Wenn er aktiviert ist, kann die KI nicht dazu verleitet werden, Befehle auszuführen, die außerhalb ihres festgelegten Bereichs liegen. Dies umfasst die Verhinderung, dass das Modell bestimmte Arten sensibler Daten liest oder ausgibt, in vom Benutzer bereitgestellten Text eingebettete Anweisungen befolgt oder ohne ausdrückliche Genehmigung auf externe Tools zugreift. Sicherheitsexperten haben jedoch angemerkt, dass der Sperrmodus möglicherweise keine vollständige Lösung darstellt. Raffinierte Angreifer könnten dennoch Wege finden, die Einschränkungen durch Techniken wie mehrstufige Reasoning-Angriffe oder die Ausnutzung von Grenzfällen im Verständnis des Modells zu umgehen. OpenAI hat diese Einschränkungen eingeräumt und den Sperrmodus als wichtige Verteidigungsschicht und nicht als Allheilmittel beschrieben. Die Funktion ist besonders relevant für Unternehmenskunden, die ChatGPT für Aufgaben wie Kundensupport, Dokumentenanalyse und internes Wissensmanagement einsetzen. Diese Anwendungsfälle beinhalten oft die Verarbeitung sensibler Informationen, deren Offenlegung schädlich sein könnte. OpenAI empfiehlt Organisationen, die den Sperrmodus verwenden, auch traditionelle Sicherheitsmaßnahmen wie Zugriffskontrollen, Datenverschlüsselung und Überwachung zu implementieren. Das Unternehmen forscht weiterhin an fortschrittlicheren Abwehrmechanismen gegen Prompt-Injection und plant die Veröffentlichung zusätzlicher Sicherheitsfunktionen.

Verwandte Nachrichten