RAG (Retrieval-Augmented Generation)

Der Vergleich

Es ist der Unterschied zwischen einer Prüfung aus dem Gedächtnis und einer Open-Book-Klausur. Ohne RAG antwortet das Modell nur mit dem, was es im Training „auswendig gelernt“ hat. Mit RAG schlägt es vor der Antwort in deiner Bibliothek nach – Dokumente, Handbücher, Datenbanken – und stützt seine Antwort auf das Gefundene.

Im Detail

RAG kombiniert eine Suchmaschine mit einem Generator: Die Frage wird in Vektoren umgewandelt, die relevantesten Abschnitte werden aus einer Dokumentenbasis abgerufen (semantische Suche) und in den Kontext des Modells eingespeist, damit es fundiert antwortet. Das reduziert Halluzinationen und erlaubt private oder aktuelle Informationen, ohne das Modell neu zu trainieren.

Ein Beispiel

Ein Beispiel Promptpedia

Ein Support-Chatbot mit RAG erfindet deine Rückgaberichtlinien nicht: Er findet das offizielle Dokument deines Unternehmens, liest es und antwortet mit Quellenangabe.