MPT-7B, um LLM open source disponível para uso comercial
(mosaicml.com)- Transformer treinado com 1 trilhão de tokens
- Qualidade semelhante ao LLaMA-7B, mas open source e disponível para uso comercial
- Também foram lançados mais 3 modelos ajustados
- MPT-7B-Instruct, MPT-7B-Chat, MPT-7B-StoryWriter-65K+ (suporte a 65K tokens)
- Foi treinado na plataforma MosaicML durante 9,5 dias, com custo de cerca de ~$200K, e permite treinar, ajustar e fazer deploy do seu próprio modelo MPT
- MPT: Mosaic Pretrained Transformers
2 comentários
Hoje em dia, vendo a quantidade enorme de modelos LLM open source com uso comercial sendo lançados,
parece que eles estão competindo para se tornar o Stable Diffusion do mundo dos LLMs.
Estou curioso para ver quem vai acabar sendo o vencedor. +_+
Acho que uma boa alternativa seria primeiro desenvolver integrando com o ChatGPT e, depois, substituir pela opção open source mais avançada.