7 pontos por sigridjineth 2025-04-08 | Ainda não há comentários. | Compartilhar no WhatsApp

O método para calcular “a probabilidade de o produto interno ser maior ou igual a um determinado valor” em um espaço de alta dimensão se baseia em um princípio simples. Basta calcular a área da superfície da esfera unitária, obter a área da calota a partir do ângulo representado por esse produto interno e então compará-la com a área total da superfície.

Mas o ponto central é que, com esse cálculo simples, é possível entender concretamente o quão “raro ou comum” um valor de produto interno realmente é em um espaço de embeddings de alta dimensão. Em especial, o fato de que um produto interno de 0,9 ou mais é extremamente raro mostra bem como, em busca baseada em embeddings, uma pontuação alta de similaridade pode ser um sinal muito importante.

Ainda não há comentários.

Ainda não há comentários.