Microsoft anuncia o Phi-4, otimizado para raciocínio

xguru · 2025-05-02T11:36:01+09:00

No 1º aniversário do lançamento da série Phi, que comprovou o potencial dos small language models (SLMs), a empresa anunciou uma nova família de modelos otimizada para raciocínio e especializada em pensamento em múltiplas etapas Mesmo com um número reduzido de parâmetros, eles apresentam desempenho comparável ao de modelos grandes Phi-4-reasoning: 14B de parâmetros, com SFT (Supervised Fine-Tuning) feito com dados de reasoning de alta qualidade Phi-4-reasoning-plus: adiciona RL (Reinforcement Learning) ao modelo acima, com melhora de precisão usando 1,5x mais tokens Phi-4-mini-reasoning: mesmo com 3.8B de tamanho, supera modelos com mais do que o dobro do tamanho em vários benchmarks de matemática, sendo adequado para mobile/edge Supera diversos modelos em desempenho, como OpenThinker-7B, Llama-3.2-3B e a família DeepSeek-R1 Resultados semelhantes ou superiores ao OpenAI o1-mini, especialmente em testes focados em matemática como Math-500 e GPQA Diamond Esses modelos também são oferecidos como Phi Silica, uma versão otimizada para NPU em PCs Copilot+, permitindo execução rápida e eficiente no ambiente Windows Disponíveis no Azure AI Foundry e no HuggingFace: Phi-4-reasoning Phi-4-reasoning-plus Phi-4-mini-reasoning APIs para desenvolvedores e ferramentas de integração local também são fornecidas, facilitando a adoção em diferentes ambientes

(azure.microsoft.com)

3 pontos por xguru 2025-05-02 | Ainda não há comentários. | Compartilhar no WhatsApp

No 1º aniversário do lançamento da série Phi, que comprovou o potencial dos small language models (SLMs), a empresa anunciou uma nova família de modelos otimizada para raciocínio e especializada em pensamento em múltiplas etapas
Mesmo com um número reduzido de parâmetros, eles apresentam desempenho comparável ao de modelos grandes
Phi-4-reasoning: 14B de parâmetros, com SFT (Supervised Fine-Tuning) feito com dados de reasoning de alta qualidade
Phi-4-reasoning-plus: adiciona RL (Reinforcement Learning) ao modelo acima, com melhora de precisão usando 1,5x mais tokens
Phi-4-mini-reasoning: mesmo com 3.8B de tamanho, supera modelos com mais do que o dobro do tamanho em vários benchmarks de matemática, sendo adequado para mobile/edge
- Supera diversos modelos em desempenho, como OpenThinker-7B, Llama-3.2-3B e a família DeepSeek-R1
- Resultados semelhantes ou superiores ao OpenAI o1-mini, especialmente em testes focados em matemática como Math-500 e GPQA Diamond
Esses modelos também são oferecidos como Phi Silica, uma versão otimizada para NPU em PCs Copilot+, permitindo execução rápida e eficiente no ambiente Windows
Disponíveis no Azure AI Foundry e no HuggingFace:
APIs para desenvolvedores e ferramentas de integração local também são fornecidas, facilitando a adoção em diferentes ambientes

Microsoft anuncia o Phi-4, otimizado para raciocínio

Leituras relacionadas

Ainda não há comentários.