nanoGPT - código aberto para treinar/ajustar modelos GPT de porte intermediário da forma mais rápida
(github.com/karpathy)- Código reescrito por Andrej Karpathy, que foi chefe de IA da Tesla, a partir do minGPT
- Objetivo de escrever um código legível e simples
train.pycom cerca de 300 linhasmodel.pycom cerca de 300 linhas
- Em andamento a reprodução do GPT-2 no conjunto de dados OpenWebText
Ainda não há comentários.