43 pontos por sigridjineth 2025-01-30 | Ainda não há comentários. | Compartilhar no WhatsApp

Um texto que percorre todo o processo de embeddings e recuperação de informação — dos conceitos e limitações de embeddings, à criação e rotulagem de datasets, avaliação de vários modelos prontos para uso, busca híbrida e re-ranking, fine-tuning e otimização de modelos de embedding, até interpretabilidade.

Tópicos abordados

  • Discussão sobre embeddings e sua capacidade de generalização (Generalizability)
  • Construção e rotulagem de datasets com humanos + LLMs
  • Avaliação de 17 modelos de busca
  • Ao usar modelos de embedding com contexto longo, a decisão de “dividir ou não os chunks”
  • Busca híbrida e re-ranking
  • Avaliação de serviços comerciais de busca em SaaS
  • Fine-tuning de modelos de embedding
  • Otimização de modelos de embedding e busca vetorial
  • Implementação de busca neural interpretável (Interpretable)

Ainda não há comentários.

Ainda não há comentários.