Zurück zum Wiki

LLM (großes Sprachmodell)

Der Motor hinter ChatGPT, Claude und Gemini.

Der Vergleich

Stell dir jemanden vor, der Millionen von Büchern, Websites und Gesprächen gelesen hat und unglaublich gut in einem einzigen Spiel geworden ist: das nächste Wort zu erraten. So gut, dass er durch das Aneinanderreihen von Vorhersagen Aufsätze schreiben, übersetzen oder programmieren kann. Das ist ein LLM: Autovervollständigung auf die Spitze getrieben.

Im Detail

Ein LLM ist ein neuronales Netz (meist mit Transformer-Architektur), das mit riesigen Textmengen trainiert wurde, um das nächste Token einer Sequenz vorherzusagen. Mit genügend Daten und Parametern entstehen Fähigkeiten wie Schlussfolgern, Zusammenfassen oder Übersetzen. Es schlägt nicht in einer Datenbank nach – es erzeugt Text, indem es Wahrscheinlichkeiten berechnet.

Ein Beispiel

Du tippst „Der Himmel ist“ und das Modell vergibt Wahrscheinlichkeiten: „blau“ (sehr hoch), „bewölkt“ (hoch), „grün“ (sehr niedrig). Für eine vollständige Antwort wiederholt es diese Berechnung hunderte Male, Wort für Wort.

Verwandte Konzepte