14 pontos por xguru 2023-05-09 | 2 comentários | Compartilhar no WhatsApp
  • Transformer treinado com 1 trilhão de tokens
  • Qualidade semelhante ao LLaMA-7B, mas open source e disponível para uso comercial
  • Também foram lançados mais 3 modelos ajustados
    • MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (suporte a 65K tokens)
  • Foi treinado na plataforma MosaicML durante 9,5 dias, com custo de cerca de ~$200K, e permite treinar, ajustar e fazer deploy do seu próprio modelo MPT
  • MPT: Mosaic Pretrained Transformers

2 comentários

 
kuroneko 2023-05-09

Hoje em dia, vendo a quantidade enorme de modelos LLM open source com uso comercial sendo lançados,
parece que eles estão competindo para se tornar o Stable Diffusion do mundo dos LLMs.

Estou curioso para ver quem vai acabar sendo o vencedor. +_+

 
xguru 2023-05-09

Acho que uma boa alternativa seria primeiro desenvolver integrando com o ChatGPT e, depois, substituir pela opção open source mais avançada.