Fenêtre de contexte — Promptpedia

01

L'analogie

Pensez à un bureau d'étudiant : il peut accueillir vos notes, un livre et pas grand-chose de plus. Pour y poser un atlas géant, il faut enlever quelque chose. La fenêtre de contexte, c'est ce bureau : le modèle ne peut « voir » que ce qui y tient à un instant donné.

02

En détail

C'est le nombre maximal de tokens que le modèle peut traiter à la fois, en additionnant votre prompt, la conversation précédente et sa propre réponse. Si la conversation dépasse la limite, les anciens messages sont tronqués ou résumés et le modèle les « oublie ». Les modèles actuels gèrent de quelques milliers à plusieurs millions de tokens.

03

Un exemple

Un exemple Promptpedia

Vous collez un contrat de 300 pages et posez une question sur la clause 2. Si le document dépasse la fenêtre, le modèle n'a peut-être jamais « lu » cette partie : mieux vaut le découper ou utiliser des techniques comme le RAG.

04

Tokens RAG (génération augmentée par récupération) Prompt système