RAG (generazione aumentata dal recupero)
Il modello smette di memorizzare e inizia a consultare.
L'analogia
È la differenza tra un esame a memoria e un esame con gli appunti. Senza RAG, il modello risponde solo con ciò che ha «memorizzato» durante l'addestramento. Con il RAG, prima di rispondere consulta la tua biblioteca — documenti, manuali, database — e scrive la risposta basandosi su ciò che trova.
Nel dettaglio
Il RAG (Retrieval-Augmented Generation) combina un motore di ricerca con un generatore: la domanda viene convertita in vettori, si recuperano i frammenti più rilevanti da una base documentale (ricerca semantica) e si inseriscono nel contesto del modello perché risponda basandosi su di essi. Riduce le allucinazioni e permette di usare informazioni private o recenti senza riaddestrare il modello.
Un esempio
Un chatbot di assistenza con RAG non si inventa la politica dei resi: cerca il documento ufficiale della tua azienda, lo legge e risponde citandolo.