Torna alla wiki

RAG (generazione aumentata dal recupero)

Il modello smette di memorizzare e inizia a consultare.

L'analogia

È la differenza tra un esame a memoria e un esame con gli appunti. Senza RAG, il modello risponde solo con ciò che ha «memorizzato» durante l'addestramento. Con il RAG, prima di rispondere consulta la tua biblioteca — documenti, manuali, database — e scrive la risposta basandosi su ciò che trova.

Nel dettaglio

Il RAG (Retrieval-Augmented Generation) combina un motore di ricerca con un generatore: la domanda viene convertita in vettori, si recuperano i frammenti più rilevanti da una base documentale (ricerca semantica) e si inseriscono nel contesto del modello perché risponda basandosi su di essi. Riduce le allucinazioni e permette di usare informazioni private o recenti senza riaddestrare il modello.

Un esempio

Un chatbot di assistenza con RAG non si inventa la politica dei resi: cerca il documento ufficiale della tua azienda, lo legge e risponde citandolo.

Concetti collegati