LLM (grand modèle de langage)

L'analogie

Imaginez quelqu'un qui a lu des millions de livres, de sites web et de conversations, et qui est devenu incroyablement fort à un seul jeu : deviner le mot suivant. Tellement fort qu'en enchaînant les prédictions, il peut rédiger des essais, traduire ou programmer. Voilà ce qu'est un LLM : la saisie automatique poussée à l'extrême.

En détail

Un LLM est un réseau de neurones (généralement de type transformer) entraîné sur d'énormes quantités de texte pour prédire le token suivant d'une séquence. Avec suffisamment de données et de paramètres, des capacités comme raisonner, résumer ou traduire émergent. Il ne consulte pas de base de données : il génère du texte en calculant des probabilités.

Un exemple

Un exemple Promptpedia

Vous écrivez « Le ciel est » et le modèle attribue des probabilités : « bleu » (très élevée), « nuageux » (élevée), « vert » (très faible). Pour générer une réponse complète, il répète ce calcul des centaines de fois, mot après mot.