RAG (geração aumentada por recuperação)

A analogia

É a diferença entre um exame de memória e um exame com consulta. Sem RAG, o modelo responde apenas com o que “memorizou” durante o treino. Com RAG, antes de responder consulta a tua biblioteca — documentos, manuais, bases de dados — e redige a resposta com base no que encontra.

Em detalhe

O RAG (Retrieval-Augmented Generation) combina um motor de busca com um gerador: a pergunta é convertida em vetores, recuperam-se os fragmentos mais relevantes de uma base documental (pesquisa semântica) e injetam-se no contexto do modelo para que responda com base neles. Reduz alucinações e permite usar informação privada ou recente sem retreinar o modelo.

Um exemplo

Um exemplo Promptpedia

Um chatbot de apoio ao cliente com RAG não inventa a política de devoluções: procura o documento oficial da tua empresa, lê-o e responde citando-o.