4 pontos por xguru 2023-09-08 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Um serviço para treinar facilmente modelos de grande escala no cluster da Hugging Face sem processos complexos
  • É possível verificar o preço alterando os principais valores na caixa de seleção
    I want to train a "7B/13B/30B/70B" parameters "text/multimodal" model on a "1.4T/3.5T/7T" tokens dataset, on "200/500/1000" "A100/H100 GPUs/Trainium Nodes"
  • Se você selecionar treinar um modelo de texto de 70B parâmetros com um conjunto de dados de 1.4T tokens usando 500 GPUs H100,
    o tempo total será de 57 dias e o preço será de $2,879,856

Ainda não há comentários.

Ainda não há comentários.