Em breve, todo banco de dados será um banco de dados vetorial

xguru · 2023-10-10T10:31:01+09:00

Banco de dados vetorial não é uma categoria separada de banco de dados Em um futuro próximo, todos os bancos de dados, incluindo bancos de dados de grafo, relacionais, de documentos e de chave-valor, além de caches, passarão a oferecer suporte a alguma forma de "busca vetorial" A fronteira entre bancos de dados vetoriais e os que não são se tornará difusa, e bancos de dados vetoriais especializados como Pinecone, Weaviate e Milvus perderão impulso e diferenciação em meio à concorrência Espera-se que os bancos de dados atuais tentem conquistar novas cargas de trabalho de RAG (Retrieval Augmented Generation) usando suas bases existentes de workloads/usuários

(nextword.substack.com)

14 pontos por xguru 2023-10-10 | 4 comentários | Compartilhar no WhatsApp

Banco de dados vetorial não é uma categoria separada de banco de dados
Em um futuro próximo, todos os bancos de dados, incluindo bancos de dados de grafo, relacionais, de documentos e de chave-valor, além de caches, passarão a oferecer suporte a alguma forma de "busca vetorial"
A fronteira entre bancos de dados vetoriais e os que não são se tornará difusa, e bancos de dados vetoriais especializados como Pinecone, Weaviate e Milvus perderão impulso e diferenciação em meio à concorrência
Espera-se que os bancos de dados atuais tentem conquistar novas cargas de trabalho de RAG (Retrieval Augmented Generation) usando suas bases existentes de workloads/usuários

4 comentários

yangeok 2023-10-26

Até o PostgreSQL já oferece suporte a módulo de vetor! Tomara que os outros engines também passem a oferecer suporte logo haha

simmani5 2023-10-11

Sei lá
Como desenvolvedor com 28 anos de carreira, sei lá???
As bibliotecas de desenvolvimento de gráficos não vão desaparecer, e sim continuar evoluindo... então não acho que haja necessidade de colocar gráficos dentro do DB.
Mesmo que DB e gráficos sejam combinados, no fim isso só aumenta a parte do DB, e como desenvolvedor isso me preocupa ainda mais. Já que, mesmo sem isso, o maior problema é ter de resolver a lentidão causada pelo volume de DB, que cresce a cada dia; a questão-chave é separar o máximo possível para customizar o desempenho e a velocidade.

sehandev 2023-10-11

A busca vetorial consiste em armazenar como vetores os embeddings usados por modelos de deep learning, como LLMs, e em executar internamente operações como calcular rapidamente a similaridade entre eles para encontrá-los ou armazená-los. Gostaria de entender o que vocês querem dizer com gráfico.

gnh1201 2023-10-11

Parece que, ao verem a palavra vetor, pensaram que fosse sinônimo porque hoje em dia bibliotecas de gráficos renderizam usando imagens vetoriais como SVG.

Foi divertido porque parece um comentário de quem conhece um pouco a realidade do setor.

O que está sendo dito ali é que o endereço por conteúdo (referência), que antes era mencionado apenas em teoria, com o rápido avanço recente das tecnologias de IA (incluindo coisas relacionadas como vectorizing), tornou-se tão fácil de implementar que já se prevê que em breve poderemos ver esse recurso até mesmo em DBMSs tradicionais.

Em breve, todo banco de dados será um banco de dados vetorial

Leituras relacionadas

4 comentários