Volver a la wiki

Temperatura

El mando que regula cuánto se atreve el modelo.

La analogía

Es como pedirle un plato a un cocinero. Con temperatura baja, sigue la receta al pie de la letra: el plato sale igual cada vez. Con temperatura alta, improvisa: a veces crea algo genial y a veces, un desastre interesante.

En detalle

La temperatura es un parámetro (típicamente entre 0 y 2) que ajusta la distribución de probabilidad al elegir cada token. Cerca de 0, el modelo escoge casi siempre la opción más probable: respuestas consistentes y predecibles. Con valores altos la probabilidad se reparte: más diversidad, más creatividad y más riesgo de error.

Un ejemplo

Para extraer fechas de una factura, temperatura 0. Para proponer veinte nombres para tu cafetería, temperatura alta. Mismo modelo, ajuste distinto.

Conceptos relacionados