- Banco de dados vetorial que pode ser embutido diretamente no aplicativo, projetado para realizar busca por similaridade em larga escala com configuração mínima
- Construído com base no motor Proxima da Alibaba, oferecendo escalabilidade de nível de produção e desempenho de busca de baixa latência
- Suporta tanto vetores densos (dense) quanto esparsos (sparse), e permite executar consultas multivetoriais com uma única chamada
- Por meio de recursos de busca híbrida, oferece busca precisa ao combinar similaridade semântica com filtragem estrutural
- Em forma de biblioteca em processo que roda sem servidor nem etapa de configuração, podendo ser executada em qualquer lugar, como notebooks, servidores, CLI e ambientes de edge
- Suporta as plataformas Linux (x86/ARM) e macOS, com instalação fácil em ambientes Python/Node.js
- Composta por um motor principal baseado em C++ e estrutura de bindings com SWIG e Python, oferecendo operações de alto desempenho e integração com várias linguagens
- Reduz o tempo de carregamento de índices e melhora a eficiência de memória com otimizações como
unordered_map para busca média de chave O(1)
- Utiliza operações de quantização Int4/Int8 para manter o equilíbrio entre velocidade e precisão no processamento de vetores em larga escala
- Licença Apache-2.0
2 comentários
A Alibaba já tinha lançado algo tipo o AliSQL, fazendo um fork do MySQL naquele post relacionado abaixo e até juntando o DuckDB para busca vetorial, então parece que anda tentando bastante coisa nova. O mesmo vale para o QWEN; na era da IA, dá a impressão de que a Alibaba é a empresa chinesa mais empenhada em atividades open source.
Vejo isso com muita frequência.