9 pontos por xguru 2024-08-08 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Versão do Llama 3.1 no estilo nanoGPT implementada por Andrej Karpathy
  • Implementação mínima da arquitetura Llama 3.1, sem dependências, permitindo treinamento, ajuste fino e inferência de forma muito simples
    • Tem menos dependências e um código menor do que as implementações da Meta e do HuggingFace
  • Atualmente focado no modelo base 8B do Llama 3.1
  • WIP: ainda está em desenvolvimento e ainda não está concluído

Ainda não há comentários.

Ainda não há comentários.