- A AI21 Labs lançou o Jamba, o primeiro modelo de IA de nível de produção do mundo baseado na arquitetura Mamba
- O Jamba combina os pontos fortes do Mamba SSM (Structured State Space Model) e da arquitetura Transformer tradicional para oferecer desempenho impressionante e ganhos de eficiência
- Ampla janela de contexto de 256K tokens. Processa até 140K tokens em uma única GPU de 80GB
Arquitetura híbrida e desempenho do Jamba
- O Jamba utiliza camadas de Mixture of Experts (MoE) por meio de uma arquitetura híbrida SSM-Transformer, usando apenas 12B dos 52B parâmetros durante a inferência
- Consegue lidar com contextos muito mais longos do que modelos concorrentes como o Llama 2 da Meta, mantendo alta taxa de processamento e eficiência
- Oferece throughput 3 vezes maior em contextos longos, sendo mais eficiente do que modelos baseados em Transformer de tamanho semelhante
- Adota uma abordagem de blocos e camadas, em que cada bloco do Jamba contém uma camada de atenção ou Mamba, seguida por um perceptron multicamadas (MLP)
- Nessa estrutura, uma camada Transformer é usada a cada 8 camadas no total
- Mostra resultados excelentes em vários benchmarks e supera ou iguala o desempenho dos modelos mais recentes do mesmo porte em uma ampla gama de tarefas
Licença
- O Jamba foi lançado com pesos abertos sob a licença Apache 2.0 e está disponível no Hugging Face
- No momento, o Jamba foi lançado como um modelo de pesquisa, sem os mecanismos de segurança necessários para uso comercial, mas a AI21 Labs planeja lançar uma versão mais segura nas próximas semanas
1 comentários
Comentários do Hacker News