Em comparação com o Llama 3.2 405B, o desempenho parece semelhante ou ligeiramente melhor
Segundo Zuck, este é o último lançamento da série Llama 3, e o Llama 4 deve ser lançado em 2025
Isso relembra a famosa fala de Steve Jobs sobre o Dropbox: "é um recurso, não um produto"
A Meta está transformando a IA em commodity ao oferecer modelos poderosos como open source, e com isso pode fortalecer os serviços do Facebook e do Instagram
A ideia não é vender IA, mas usar IA para fortalecer o negócio principal
Ao disponibilizar em open source, obtém-se a vantagem de adoção ampla e desenvolvimento pela comunidade
Em nossos benchmarks, teve um desempenho melhor do que o esperado
Vamos analisar mais a fundo, mas é impressionante
Continua a discussão sobre um bom cliente de desktop "geral" para Mac
Querem usar Ollama, ChatGPT, Claude, Perplexity etc.
Querem usar chat com IA em vários apps, e não precisa necessariamente ser um app de desktop
O MacMind é bacana, mas fica caro por ser front-end para outras APIs
A resposta "não seja pão-duro" também parece razoável
Em vários benchmarks, mostra desempenho parecido com o GPT-4o
Fizeram upload para o Hugging Face de pesos em 4bit bitsandbytes, GGUFs e os pesos originais em 16bit
É possível ajustar finamente o Llama 3.3 70B 2x mais rápido com menos de 48GB de VRAM, além de reduzir o uso de memória em 70%
Estão acompanhando o preço de 1M de tokens no OpenRouter, e o valor está caindo a cada atualização da página
O open sourcing do Llama é um excelente exemplo da estratégia "Commoditize Your Complement"
Para quem nunca ouviu falar dessa estratégia, foi compartilhado o link de Gwern: "Laws of Tech: Commoditize Your Complement"
Perguntas sobre o modelo no Hugging Face
Se dá para rodar em um notebook via JupyterLab
Quais são as vantagens
Se pode ser atualizado regularmente
Se pode ser ajustado finamente para um caso de uso específico
Quanto tempo e esforço são necessários para ajustar finamente o modelo
Pedido de URL para saber se o Hugging Face oferece respostas para essas perguntas
A Meta continua superando expectativas ao lançar modelos abertos poderosos para competir com OpenAI/Anthropic
1 comentários
Opiniões no Hacker News
Em comparação com o Llama 3.2 405B, o desempenho parece semelhante ou ligeiramente melhor
Em nossos benchmarks, teve um desempenho melhor do que o esperado
Continua a discussão sobre um bom cliente de desktop "geral" para Mac
Em vários benchmarks, mostra desempenho parecido com o GPT-4o
Fizeram upload para o Hugging Face de pesos em 4bit bitsandbytes, GGUFs e os pesos originais em 16bit
Estão acompanhando o preço de 1M de tokens no OpenRouter, e o valor está caindo a cada atualização da página
O open sourcing do Llama é um excelente exemplo da estratégia "Commoditize Your Complement"
Perguntas sobre o modelo no Hugging Face
A Meta continua superando expectativas ao lançar modelos abertos poderosos para competir com OpenAI/Anthropic