14 pontos por xguru 2023-10-10 | 4 comentários | Compartilhar no WhatsApp
  • Banco de dados vetorial não é uma categoria separada de banco de dados
  • Em um futuro próximo, todos os bancos de dados, incluindo bancos de dados de grafo, relacionais, de documentos e de chave-valor, além de caches, passarão a oferecer suporte a alguma forma de "busca vetorial"
  • A fronteira entre bancos de dados vetoriais e os que não são se tornará difusa, e bancos de dados vetoriais especializados como Pinecone, Weaviate e Milvus perderão impulso e diferenciação em meio à concorrência
  • Espera-se que os bancos de dados atuais tentem conquistar novas cargas de trabalho de RAG (Retrieval Augmented Generation) usando suas bases existentes de workloads/usuários

4 comentários

 
yangeok 2023-10-26

Até o PostgreSQL já oferece suporte a módulo de vetor! Tomara que os outros engines também passem a oferecer suporte logo haha

 
simmani5 2023-10-11

Sei lá
Como desenvolvedor com 28 anos de carreira, sei lá???
As bibliotecas de desenvolvimento de gráficos não vão desaparecer, e sim continuar evoluindo... então não acho que haja necessidade de colocar gráficos dentro do DB.
Mesmo que DB e gráficos sejam combinados, no fim isso só aumenta a parte do DB, e como desenvolvedor isso me preocupa ainda mais. Já que, mesmo sem isso, o maior problema é ter de resolver a lentidão causada pelo volume de DB, que cresce a cada dia; a questão-chave é separar o máximo possível para customizar o desempenho e a velocidade.

 
sehandev 2023-10-11

A busca vetorial consiste em armazenar como vetores os embeddings usados por modelos de deep learning, como LLMs, e em executar internamente operações como calcular rapidamente a similaridade entre eles para encontrá-los ou armazená-los. Gostaria de entender o que vocês querem dizer com gráfico.

 
gnh1201 2023-10-11

Parece que, ao verem a palavra vetor, pensaram que fosse sinônimo porque hoje em dia bibliotecas de gráficos renderizam usando imagens vetoriais como SVG.

Foi divertido porque parece um comentário de quem conhece um pouco a realidade do setor.

O que está sendo dito ali é que o endereço por conteúdo (referência), que antes era mencionado apenas em teoria, com o rápido avanço recente das tecnologias de IA (incluindo coisas relacionadas como vectorizing), tornou-se tão fácil de implementar que já se prevê que em breve poderemos ver esse recurso até mesmo em DBMSs tradicionais.