Kontextfenster
Das Arbeitsgedächtnis des Modells: Was nicht hineinpasst, existiert nicht.
Der Vergleich
Denk an einen Schreibtisch: Darauf passen deine Notizen, ein Buch und nicht viel mehr. Willst du einen riesigen Atlas dazulegen, muss etwas anderes runter. Das Kontextfenster ist dieser Schreibtisch: Das Modell „sieht“ nur, was gerade darauf liegt.
Im Detail
Es ist die maximale Anzahl an Tokens, die das Modell auf einmal verarbeiten kann – dein Prompt, der bisherige Gesprächsverlauf und die eigene Antwort zusammengenommen. Überschreitet das Gespräch die Grenze, werden ältere Nachrichten abgeschnitten oder zusammengefasst, und das Modell „vergisst“ sie. Aktuelle Modelle verarbeiten zwischen Tausenden und Millionen von Tokens.
Ein Beispiel
Du fügst einen 300-seitigen Vertrag ein und fragst nach Klausel 2. Wenn das Dokument das Fenster sprengt, hat das Modell diesen Teil vielleicht nie „gelesen“ – besser aufteilen oder Techniken wie RAG nutzen.