KI als Sicherheitsrisiko
Wie sich Chatbots mit "Jailbreaks" entfesseln lassen

KI-Chatbots sollen immer sicherer werden. Doch fast jedes Sprachmodell lässt sich überreden, Grenzen zu ignorieren, die ihm seine Entwickler gesetzt haben. Das kann unterhaltsam sein - oder brandgefährlich.

Wolfangel, Eva; Metz, Moritz |
3D-Illustration eines Vogelkäfigs, der von einer Hand am Bildrand angehoben wird. Darunter stehen die Buchstaben AI.
Egal, wie sicher der "System Prompt" formuliert ist: Hackern gelingt es fast immer, die Nutzungsbeschränkungen von KI-Sprachmodellen auszuhebeln. (Getty Images / wildpixel)