8 pontos por xguru 2023-01-04 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Código reescrito por Andrej Karpathy, que foi chefe de IA da Tesla, a partir do minGPT
  • Objetivo de escrever um código legível e simples
    • train.py com cerca de 300 linhas
    • model.py com cerca de 300 linhas
  • Em andamento a reprodução do GPT-2 no conjunto de dados OpenWebText

Ainda não há comentários.

Ainda não há comentários.