Garde-fous (guardrails)
Les règles qui empêchent l'assistant de sortir de la route.
L'analogie
Ce sont comme les glissières d'une route de montagne : elles ne conduisent pas à votre place, mais vous empêchent de partir dans le virage. Elles filtrent ce qui entre et ce qui sort pour que l'assistant ne dise ni ne fasse rien de dangereux ou de déplacé.
En détail
Les garde-fous sont des contrôles ajoutés autour du modèle : filtres de contenu, règles dans le prompt système, validation des sorties et limites sur les outils qu'il peut utiliser. Ils ne changent pas le modèle de l'intérieur ; ils l'enveloppent pour que son comportement soit sûr et prévisible.
Un exemple
Un assistant médical bien protégé refuse de poser un diagnostic définitif, évite de recommander des doses précises et conseille toujours de consulter un professionnel. Ces refus, ce sont les garde-fous à l'œuvre.