7 pontos por xguru 2023-07-03 | 1 comentários | Compartilhar no WhatsApp
  • Implementação open source do modelo Flamingo, da DeepMind
  • Modelos 3B, 4B e 9B foram disponibilizados
    • Baseados em MPT-1B/7B e RedPajama-3B
  • Alcança mais de 80% do desempenho do modelo Flamingo original
  • Código de treinamento e avaliação aprimorado
    • Suporte a Fully Sharded Data Parallel (FSDP)
    • Novos conjuntos de dados adicionados ao pacote de avaliação: TextVQA, VizWiz, HatefulMemes e Flickr30k