25 pontos por xguru 2023-04-03 | 1 comentários | Compartilhar no WhatsApp
  • Open source completamente desenvolvido de forma separada, com licença Apache 2.0 e baseado em nanoGPT, em vez do código do LLaMA sob licença GPL
  • Implementado em um único arquivo, sem boilerplate, o que o torna simples, e numericamente idêntico aos modelos existentes
  • Suporta FlashAttention, quantização, fine-tuning com LoRA e pré-treinamento
  • Otimizado para rodar em hardware de consumo

1 comentários

 
xguru 2023-04-03

nanoGPT é um código em que Andrej Karpathy, ex-chefe de IA da Tesla, reescreveu o minGPT.
nanoGPT - open source para treinar/ajustar finamente GPTs de porte intermediário da forma mais rápida

FlashAttention