- A Replit lançou um novo LLM de geração de código como open source com uso comercial permitido.
- Com 2,7B de parâmetros, é leve e rápido, e o treinamento foi concluído em apenas 10 dias.
- Em comparação com modelos da mesma categoria, apresenta melhoria de 40% no desempenho, e o modelo ajustado tem desempenho superior ao Codex.
- Foi treinado com o dataset The Stack e pode gerar código em mais de 20 linguagens.
- Uma demonstração pode ser usada diretamente no Hugging Face.
2 comentários
Ultimamente, tenho a impressão de que o número de LLMs open source com uso comercial permitido está aumentando bastante. Talvez tenham sido estimulados pelo LLaMA...
E também gosto do fato de que o desempenho melhorou bastante em relação ao tamanho do modelo.
Nesse nível, fico pensando se já não daria para rodar localmente em um computador comum de desenvolvimento, sem GPU.