Embedding
Trasformare i significati in coordinate che la macchina può confrontare.
L'analogia
Immagina una mappa gigante dove ogni parola o frase ha il suo indirizzo: «cane» e «cucciolo» abitano nella stessa via, «auto» sta in un altro quartiere e «fattura» in un'altra città. Un embedding è quell'indirizzo: numeri che collocano ogni testo sulla mappa del significato, così che «vicino» significhi «simile».
Nel dettaglio
Un embedding è un vettore (centinaia o migliaia di numeri) che rappresenta il significato di un testo, un'immagine o un audio. Testi simili producono vettori vicini, il che permette la ricerca semantica: confrontare distanze invece di parole esatte. È il pezzo che fa funzionare il RAG, i sistemi di raccomandazione e il rilevamento dei duplicati.
Un esempio
Cerchi «come restituisco un ordine?» e il sistema trova il documento intitolato «Politica dei rimborsi» anche se non condividono nemmeno una parola: i loro embedding sono vicini sulla mappa.