Embeddings
Transformar significados em coordenadas que a máquina pode comparar.
A analogia
Imagina um mapa gigante onde cada palavra ou frase tem a sua morada: “cão” e “cachorro” vivem na mesma rua, “carro” fica noutro bairro e “fatura” noutra cidade. Um embedding é essa morada: números que colocam cada texto no mapa do significado, de modo que “perto” signifique “parecido”.
Em detalhe
Um embedding é um vetor (centenas ou milhares de números) que representa o significado de um texto, imagem ou áudio. Textos semelhantes produzem vetores próximos, o que permite a pesquisa semântica: comparar distâncias em vez de palavras exatas. É a peça que faz funcionar o RAG, os recomendadores e a deteção de duplicados.
Um exemplo
Pesquisas “como devolvo uma encomenda?” e o sistema encontra o documento “Política de reembolsos”, embora não partilhem uma única palavra: os seus embeddings estão próximos no mapa.