Torna alla wiki

LLM (grande modello linguistico)

Il motore dietro ChatGPT, Claude e Gemini.

L'analogia

Immagina una persona che ha letto milioni di libri, siti web e conversazioni, ed è diventata incredibilmente brava in un solo gioco: indovinare la parola successiva. Così brava che, concatenando una previsione dopo l'altra, riesce a scrivere saggi, tradurre o programmare. Ecco cos'è un LLM: il completamento automatico portato all'estremo.

Nel dettaglio

Un LLM è una rete neurale (di solito con architettura transformer) addestrata su enormi quantità di testo per prevedere il token successivo di una sequenza. Con dati e parametri sufficienti emergono capacità come ragionare, riassumere o tradurre. Non consulta un database: genera testo calcolando probabilità.

Un esempio

Scrivi «Il cielo è» e il modello assegna probabilità: «azzurro» (molto alta), «nuvoloso» (alta), «verde» (bassissima). Per generare una risposta completa ripete quel calcolo centinaia di volte, parola dopo parola.

Concetti collegati