Voltar à wiki

LLM (grande modelo de linguagem)

O motor por trás do ChatGPT, do Claude e do Gemini.

A analogia

Imagina alguém que leu milhões de livros, sites e conversas e se tornou incrivelmente bom num único jogo: adivinhar a palavra seguinte. Tão bom que, encadeando uma previsão atrás da outra, consegue escrever ensaios, traduzir ou programar. Isso é um LLM: o preenchimento automático levado ao extremo.

Em detalhe

Um LLM é uma rede neuronal (normalmente com arquitetura transformer) treinada com enormes quantidades de texto para prever o token seguinte de uma sequência. Com dados e parâmetros suficientes, emergem capacidades como raciocinar, resumir ou traduzir. Não consulta uma base de dados: gera texto calculando probabilidades.

Um exemplo

Escreves “O céu está” e o modelo atribui probabilidades: “azul” (muito alta), “nublado” (alta), “verde” (baixíssima). Para gerar uma resposta completa, repete esse cálculo centenas de vezes, palavra a palavra.

Conceitos relacionados