- Contexto de 128K, suporte a 8 idiomas e adição do modelo 405B (8B, 70B, 405B)
- Modelo de IA open source ajustado por instruções que qualquer pessoa pode refinar, aprimorar e implantar em qualquer lugar
- O novo modelo 405B recém-lançado alcança desempenho quase igual ou superior ao GPT-4o em benchmarks como MMLU (geral), Human Eval (código) e GSM8K (matemática)
- Um modelo de IA de nível máximo em flexibilidade e controle
- Permite que a comunidade utilize novos fluxos de trabalho, como geração de dados sintéticos e destilação de modelos
- Foi treinado com mais de 15 trilhões de tokens e usando mais de 16.000 GPUs H100
- O modelo 70B atualizado supera com folga o GPT-3.5 Turbo na maioria dos benchmarks
3 comentários
Nossa, fico imaginando como teria que configurar as GPUs para subir o 405B.
Parece que o 405B não é para fine-tuning direto nem para serving. Pelo fato de o CEO ter mencionado destilação várias vezes, talvez ele seja usado como modelo teacher para fine-tuning a fim de melhorar a qualidade de modelos menores.
Comentários do Hacker News
Os modelos Llama 3.1 melhoraram em desempenho
Comparação entre GPT-4o e o modelo Llama 3.1 405B
É possível conversar com os novos modelos no Groq.com com latência ultrabaixa
Com o hardware adequado, é possível rodar em casa um LLM capaz de competir com o GPT-4o
É possível executar os modelos localmente com Ollama, Huggingface, Groq e outros
O resultado de rodar a versão 70B no Ollama foi muito bom
Claude 3.5 Sonnet é muito bom para tarefas de programação
Pergunta sobre informações de preço de modelos open source