- A Mistral revelou o Pixtral 12B, seu primeiro modelo capaz de processar tanto imagens quanto texto
- Um modelo com 12 bilhões de parâmetros e cerca de 24 GB de tamanho
- Foi construído com base no Nemo 12B, modelo de texto da Mistral
- Pode responder a perguntas sobre um número e tamanho arbitrários de imagens por meio de URLs ou imagens codificadas em base64
- Assim como outros modelos multimodais, como a família Claude da Anthropic ou o GPT-4 da OpenAI, espera-se que consiga realizar tarefas como legendagem de imagens e contagem de objetos em fotos
- Pode ser baixado no GitHub e no Hugging Face por meio de links de torrent
- Pode ser baixado, ajustado por fine-tuning e usado sem restrições sob a licença Apache 2.0
- No momento, a demo web não está funcionando, mas em breve poderá ser testado no Le Chat e no Le Plateforme, a plataforma de chatbot e serviços de API da Mistral
- Recentemente, a Mistral concluiu uma rodada de financiamento de US$ 645 milhões liderada pela General Catalyst, alcançando uma avaliação de US$ 6 bilhões
- Fundada há pouco mais de um ano, a Mistral tem a Microsoft como acionista minoritária e é considerada a OpenAI da Europa
- A empresa adota a estratégia de lançar modelos "abertos" gratuitos, cobrar por versões gerenciadas e oferecer serviços de consultoria para clientes corporativos
Ainda não há comentários.