Voltar à wiki

Embeddings

Transformar significados em coordenadas que a máquina pode comparar.

A analogia

Imagina um mapa gigante onde cada palavra ou frase tem a sua morada: “cão” e “cachorro” vivem na mesma rua, “carro” fica noutro bairro e “fatura” noutra cidade. Um embedding é essa morada: números que colocam cada texto no mapa do significado, de modo que “perto” signifique “parecido”.

Em detalhe

Um embedding é um vetor (centenas ou milhares de números) que representa o significado de um texto, imagem ou áudio. Textos semelhantes produzem vetores próximos, o que permite a pesquisa semântica: comparar distâncias em vez de palavras exatas. É a peça que faz funcionar o RAG, os recomendadores e a deteção de duplicados.

Um exemplo

Pesquisas “como devolvo uma encomenda?” e o sistema encontra o documento “Política de reembolsos”, embora não partilhem uma única palavra: os seus embeddings estão próximos no mapa.

Conceitos relacionados