Ventana de contexto
La memoria de trabajo del modelo: lo que no cabe, no existe.
La analogía
Piensa en una mesa de estudio: caben tus apuntes, un libro y poco más. Si quieres añadir un atlas gigante, algo tiene que salir de la mesa. La ventana de contexto es esa mesa: el modelo solo puede “ver” lo que cabe en ella en cada momento.
En detalle
Es el número máximo de tokens que el modelo puede procesar a la vez, sumando tu prompt, la conversación previa y su propia respuesta. Si la conversación supera el límite, los mensajes antiguos se truncan o se resumen y el modelo los “olvida”. Los modelos actuales manejan desde miles hasta millones de tokens.
Un ejemplo
Pegas un contrato de 300 páginas y preguntas por la cláusula 2. Si el documento excede la ventana, puede que el modelo nunca llegara a “leer” esa parte: conviene trocearlo o usar técnicas como RAG.