LLM (grande modello linguistico)
Il motore dietro ChatGPT, Claude e Gemini.
L'analogia
Immagina una persona che ha letto milioni di libri, siti web e conversazioni, ed è diventata incredibilmente brava in un solo gioco: indovinare la parola successiva. Così brava che, concatenando una previsione dopo l'altra, riesce a scrivere saggi, tradurre o programmare. Ecco cos'è un LLM: il completamento automatico portato all'estremo.
Nel dettaglio
Un LLM è una rete neurale (di solito con architettura transformer) addestrata su enormi quantità di testo per prevedere il token successivo di una sequenza. Con dati e parametri sufficienti emergono capacità come ragionare, riassumere o tradurre. Non consulta un database: genera testo calcolando probabilità.
Un esempio
Scrivi «Il cielo è» e il modello assegna probabilità: «azzurro» (molto alta), «nuvoloso» (alta), «verde» (bassissima). Per generare una risposta completa ripete quel calcolo centinaia di volte, parola dopo parola.