Lançamento do Meta Llama 3.2 - tecnologia que revoluciona a IA de borda e a visão com modelos abertos e personalizáveis
(ai.meta.com)-
Meta lança o Llama 3.2
- Inclui LLMs de visão pequenos e médios (11B e 90B) e modelos leves somente de texto (1B e 3B)
- Disponível em hardware da Qualcomm e da MediaTek, com otimização para processadores Arm
- Modelos adequados para tarefas de resumo, seguimento de instruções e reescrita
-
Características dos modelos Llama 3.2
- Os modelos de visão 11B e 90B se destacam em tarefas de compreensão de imagem
- Permitem ajuste fino para aplicações personalizadas com
torchtune - Permitem implantação local com
torchchat - Disponíveis por meio do assistente inteligente Meta AI
-
Implantação do Llama Stack
- Simplifica o trabalho com modelos Llama em ambientes de nó único, on-premises, nuvem e on-device
- Implantado em parceria com AWS, Databricks, Dell Technologies, Fireworks, Infosys e Together AI
-
Download dos modelos Llama 3.2
- Disponível para download em llama.com e Hugging Face
- Desenvolvimento imediato disponível em plataformas parceiras como AMD, AWS, Databricks, Dell, Google Cloud, Groq, IBM, Intel, Microsoft Azure, NVIDIA, Oracle Cloud e Snowflake
-
Desempenho do Llama 3.2
- Os modelos 11B e 90B são adequados para compreensão em nível de documento, geração de legendas de imagem e tarefas com base visual
- Os modelos 1B e 3B oferecem geração de texto multilíngue e recursos de chamada de ferramentas
- Quando executados localmente, oferecem resposta imediata e maior privacidade
-
Avaliação dos modelos
- Desempenho avaliado em mais de 150 conjuntos de dados de benchmark
- Desempenho competitivo com Claude 3 Haiku e GPT4o-mini
-
Modelos de visão
- Introdução de uma nova arquitetura de modelo para suportar entrada de imagem
- Mantêm capacidades somente de texto, ao mesmo tempo em que combinam prompts de imagem e texto para compreensão e raciocínio aprofundados
-
Modelos leves
- Os modelos 1B e 3B foram desenvolvidos usando métodos de poda e destilação de conhecimento
- Podem ser executados localmente com eficiência
-
Implantação do Llama Stack
- Fornece uma interface padronizada por meio da API do Llama Stack
- Simplifica o trabalho com modelos Llama em diversos ambientes
-
Segurança em nível de sistema
- Lançamento do Llama Guard 3 11B Vision
- O modelo Llama Guard 3 1B reduz significativamente o custo de implantação
-
Uso do Llama 3.2
- Fornece aos desenvolvedores as ferramentas e os recursos necessários
- Com o Llama 3.2 e o Llama Stack, é possível desenvolver aplicações inovadoras
Resumo do GN⁺
- O Llama 3.2 oferece diversos modelos de visão e texto, incluindo modelos leves que podem ser executados em dispositivos de borda e móveis
- Por meio de parcerias com Qualcomm, MediaTek, Arm e outras empresas, oferece desempenho otimizado em diferentes hardwares
- Com a implantação do Llama Stack, ajuda desenvolvedores a usar facilmente modelos Llama em diversos ambientes
- O Llama 3.2 oferece alta privacidade e resposta imediata, sendo adequado para o desenvolvimento de aplicações locais
- Oferece desempenho capaz de competir com Claude 3 Haiku e GPT4o-mini, comprovado em diversos benchmarks
1 comentários
Comentários do Hacker News
Surpreso com o desempenho do novo modelo 1B. O tamanho do download é de 1,3 GB
No exemplo "The Llama jumped over the ______!", com codificação 1-hot, "wall" é a resposta correta com 100% de probabilidade
Impressionado com a abertura da equipe Llama da Meta. Eles não apenas dão acesso ao modelo, como também divulgam como ele foi construído
Pergunta de iniciante: preciso de um modelo com capacidade 10x de um engenheiro de software, mas não preciso de conhecimento humano. Queria saber se existe um modelo assim
Testei o modelo 3B no Ollama. Ele é rápido e tem muito conhecimento sobre óptica, biologia e Rust
Post do blog da Ollama: link
O modelo llama3.2:3b-instruct-q8_0 tem desempenho melhor que o 3.1 8b-q4. É mais rápido e entrega resultados melhores em um MacBook Pro M1
Pergunta se alguém pode recomendar um cliente web UI para o Ollama
Pergunta se existe algum leaderboard com os benchmarks mais recentes de LLMs
O modelo 3B foi bem decente em multimodal (norueguês), mas às vezes dá muitas respostas sem sentido. É mais sensível que o 8B, mas mais utilizável que o Gemma 2 2B