- Modelo de embedding de texto
jina-embeddings-v2 com suporte a comprimento de 8192 tokens
- Compete com o
text-embedding-ada-002 da OpenAI e, em benchmarks, apresenta desempenho superior em classificação, reclassificação, busca e resumo
- Foi reconstruído do zero e, com contexto de 8k, pode ser usado em diversas áreas: análise de documentos jurídicos, pesquisa médica, análise literária, previsão financeira e IA conversacional
- Dois modelos podem ser baixados no HuggingFace
- Base Model (0.27G): projetado para tarefas intensivas que exigem alta precisão, como pesquisa acadêmica ou análise de negócios
- Small Model (0.07G): criado para aplicações leves, como apps móveis ou dispositivos com recursos computacionais limitados
1 comentários
Opiniões do Hacker News
text-embedding-ada-002(768 vs 1536), o que pode economizar espaço no banco de dados e tornar as consultas mais rápidas.