Torna alla wiki

Parametri

I milioni di «manopole» interne dove vive ciò che il modello ha imparato.

L'analogia

Pensa a un mixer con miliardi di minuscole manopole. Durante l'addestramento, ogni esempio ne gira leggermente alcune finché la «canzone» non suona bene. Ciò che il modello impara non si salva come frasi: si salva come la posizione esatta di tutte quelle manopole.

Nel dettaglio

I parametri (o pesi) sono i numeri regolabili della rete neurale; si fissano durante l'addestramento e determinano come viene trasformato ogni input. «7B» o «70B» indicano miliardi di parametri. Più parametri di solito significano più capacità, ma anche più costi di addestramento e inferenza; la qualità dei dati conta quanto la dimensione.

Un esempio

Un modello «7B» sta in un portatile potente e risponde veloce; uno da centinaia di miliardi richiede server specializzati. Per questo esistono famiglie di modelli di diverse dimensioni per usi diversi.

Concetti collegati