LLM (gran modelo de lenguaje)

01

La analogía

Imagina a alguien que ha leído millones de libros, webs y conversaciones, y que se ha vuelto increíblemente bueno en un solo juego: adivinar la siguiente palabra. Tan bueno que, encadenando una predicción tras otra, es capaz de escribir ensayos, traducir o programar. Eso es un LLM: un autocompletado llevado al extremo.

02

En detalle

Un LLM es una red neuronal (normalmente con arquitectura transformer) entrenada con enormes cantidades de texto para predecir el siguiente token de una secuencia. Con suficientes datos y parámetros emergen capacidades como razonar, resumir o traducir. No consulta una base de datos: genera texto calculando probabilidades.

03

Un ejemplo

Un ejemplo Promptpedia

Le escribes “El cielo está” y el modelo asigna probabilidades: “azul” (muy alta), “nublado” (alta), “verde” (bajísima). Al generar una respuesta completa repite ese cálculo cientos de veces, palabra a palabra.

04

Tokens Parámetros Ventana de contexto