RAG (generación aumentada por recuperación)

La analogía

Es la diferencia entre un examen de memoria y un examen con apuntes. Sin RAG, el modelo responde solo con lo que “memorizó” durante su entrenamiento. Con RAG, antes de responder consulta tu biblioteca —documentos, manuales, bases de datos— y redacta apoyándose en lo que encuentra.

En detalle

RAG (Retrieval-Augmented Generation) combina un buscador con un generador: la pregunta se convierte en vectores, se recuperan los fragmentos más relevantes de una base documental (búsqueda semántica) y se inyectan en el contexto del modelo para que responda basándose en ellos. Reduce alucinaciones y permite usar información privada o reciente sin reentrenar el modelo.

Un ejemplo

Un ejemplo Promptpedia

Un chatbot de soporte con RAG no se inventa la política de devoluciones: busca el documento oficial de tu empresa, lo lee y responde citándolo.