6 pontos por xguru 2023-08-25 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Dataset criado pelo Allen Institute for AI
  • Mistura de conteúdo da web, publicações acadêmicas, código, livros e materiais de enciclopédia
  • Com 3 trilhões (trillion) de tokens, é o maior dataset já disponibilizado publicamente até agora
  • Disponível para download no hub do HuggingFace
  • Licença AI2 ImpACT (classificada em Low/Medium/High de acordo com o risco do artifact)

Ainda não há comentários.

Ainda não há comentários.