Lançamento beta do novo serviço de plataforma da Mistral AI
- A Mistral AI oferece aos desenvolvedores modelos generativos abertos e poderosos, além de formas eficientes de implantá-los e personalizá-los.
- O acesso beta ao seu primeiro serviço de plataforma começa hoje, oferecendo três endpoints de chatbot que geram texto a partir de instruções em texto, além de um endpoint de embeddings.
- Cada endpoint apresenta um trade-off diferente entre desempenho e preço.
Endpoints de geração
mistral-tinyemistral-smallusam os dois modelos atualmente públicos, enquantomistral-mediumusa um modelo protótipo que está sendo testado em ambiente de produção.- Os modelos integram as técnicas de alinhamento mais eficazes, como fine-tuning eficiente e otimização direta por preferências, para criar modelos fáceis de controlar e agradáveis de usar.
Mistral-tinyoferece suporte apenas a inglês,Mistral-smalloferece suporte a vários idiomas e código, eMistral-mediumé avaliado como um dos modelos de serviço de mais alto nível.
Endpoint de embeddings
Mistral-embedoferece um modelo de embeddings pensado para busca, com dimensão de embedding de 1024.- Esse modelo de embeddings alcançou uma pontuação de busca de 55,26 no MTEB.
Especificação da API
- A API segue a especificação da popular interface de chatbot proposta inicialmente por um concorrente.
- Bibliotecas cliente para Python e Javascript estão disponíveis para consultar os endpoints.
- Os endpoints permitem fornecer prompts de sistema para que os usuários definam um nível mais alto de moderação sobre as saídas do modelo.
Expansão do acesso beta para disponibilidade geral
- A partir de hoje, qualquer pessoa pode se cadastrar e usar a API, e a capacidade será aumentada gradualmente.
- A equipe de negócios pode ajudar a entender os requisitos e acelerar o acesso.
- Pode haver instabilidades enquanto a plataforma é estabilizada para se tornar totalmente self-service.
Agradecimentos
- Agradecimento à NVIDIA pelo suporte à integração com TensorRT-LLM e Triton, e por colaborar na criação de uma mistura esparsa de especialistas compatível com TRT-LLM.
Opinião do GN⁺
- O ponto mais importante deste artigo é que a Mistral AI está disponibilizando novos modelos generativos e de embeddings para desenvolvedores, permitindo o uso de recursos melhores de geração de texto e embeddings.
- Essas tecnologias devem impulsionar o avanço da inteligência artificial, e a capacidade de oferecer suporte a vários idiomas e código deve ampliar bastante as possibilidades de aplicação no mercado global.
- Para os desenvolvedores, isso representa uma oportunidade empolgante de criar projetos e soluções criativas com novas ferramentas e APIs, o que aumenta a expectativa sobre o futuro da tecnologia.
1 comentários
Comentários do Hacker News