Janela de contexto
A memória de trabalho do modelo: o que não cabe, não existe.
A analogia
Pensa numa secretária de estudo: cabem os teus apontamentos, um livro e pouco mais. Se quiseres acrescentar um atlas gigante, algo tem de sair da secretária. A janela de contexto é essa secretária: o modelo só consegue “ver” o que lá cabe em cada momento.
Em detalhe
É o número máximo de tokens que o modelo consegue processar de uma vez, somando o teu prompt, a conversa anterior e a própria resposta. Se a conversa ultrapassar o limite, as mensagens antigas são truncadas ou resumidas e o modelo “esquece-as”. Os modelos atuais lidam com milhares a milhões de tokens.
Um exemplo
Colas um contrato de 300 páginas e perguntas pela cláusula 2. Se o documento exceder a janela, o modelo pode nunca ter chegado a “ler” essa parte: convém dividi-lo ou usar técnicas como o RAG.