19 pontos por kuroneko 2023-05-04 | 2 comentários | Compartilhar no WhatsApp
  • A Replit lançou um novo LLM de geração de código como open source com uso comercial permitido.
  • Com 2,7B de parâmetros, é leve e rápido, e o treinamento foi concluído em apenas 10 dias.
  • Em comparação com modelos da mesma categoria, apresenta melhoria de 40% no desempenho, e o modelo ajustado tem desempenho superior ao Codex.
  • Foi treinado com o dataset The Stack e pode gerar código em mais de 20 linguagens.
  • Uma demonstração pode ser usada diretamente no Hugging Face.

2 comentários

 
kuroneko 2023-05-04

Ultimamente, tenho a impressão de que o número de LLMs open source com uso comercial permitido está aumentando bastante. Talvez tenham sido estimulados pelo LLaMA...

E também gosto do fato de que o desempenho melhorou bastante em relação ao tamanho do modelo.
Nesse nível, fico pensando se já não daria para rodar localmente em um computador comum de desenvolvimento, sem GPU.