Schutzplanken (Guardrails)
Die Regeln, die den Assistenten auf der Spur halten.
Der Vergleich
Sie sind wie die Leitplanken einer Bergstraße: Sie fahren nicht für dich, aber sie verhindern, dass du in der Kurve abfliegst. Sie filtern, was hinein- und herauskommt, damit der Assistent nichts Gefährliches oder Unpassendes sagt oder tut.
Im Detail
Guardrails sind Kontrollen rund um das Modell: Inhaltsfilter, Regeln im System-Prompt, Validierung der Ausgaben und Grenzen, welche Werkzeuge es nutzen darf. Sie ändern das Modell nicht von innen; sie umhüllen es, damit sein Verhalten sicher und vorhersehbar ist.
Ein Beispiel
Ein gut abgesicherter medizinischer Assistent verweigert eine endgültige Diagnose, vermeidet konkrete Dosisempfehlungen und rät stets, eine Fachkraft aufzusuchen. Diese Absagen sind die Guardrails in Aktion.