Voltar à wiki

Janela de contexto

A memória de trabalho do modelo: o que não cabe, não existe.

A analogia

Pensa numa secretária de estudo: cabem os teus apontamentos, um livro e pouco mais. Se quiseres acrescentar um atlas gigante, algo tem de sair da secretária. A janela de contexto é essa secretária: o modelo só consegue “ver” o que lá cabe em cada momento.

Em detalhe

É o número máximo de tokens que o modelo consegue processar de uma vez, somando o teu prompt, a conversa anterior e a própria resposta. Se a conversa ultrapassar o limite, as mensagens antigas são truncadas ou resumidas e o modelo “esquece-as”. Os modelos atuais lidam com milhares a milhões de tokens.

Um exemplo

Colas um contrato de 300 páginas e perguntas pela cláusula 2. Se o documento exceder a janela, o modelo pode nunca ter chegado a “ler” essa parte: convém dividi-lo ou usar técnicas como o RAG.

Conceitos relacionados