- No 1º aniversário do lançamento da série Phi, que comprovou o potencial dos small language models (SLMs), a empresa anunciou uma nova família de modelos otimizada para raciocínio e especializada em pensamento em múltiplas etapas
- Mesmo com um número reduzido de parâmetros, eles apresentam desempenho comparável ao de modelos grandes
- Phi-4-reasoning: 14B de parâmetros, com SFT (Supervised Fine-Tuning) feito com dados de reasoning de alta qualidade
- Phi-4-reasoning-plus: adiciona RL (Reinforcement Learning) ao modelo acima, com melhora de precisão usando 1,5x mais tokens
- Phi-4-mini-reasoning: mesmo com 3.8B de tamanho, supera modelos com mais do que o dobro do tamanho em vários benchmarks de matemática, sendo adequado para mobile/edge
- Supera diversos modelos em desempenho, como OpenThinker-7B, Llama-3.2-3B e a família DeepSeek-R1
- Resultados semelhantes ou superiores ao OpenAI o1-mini, especialmente em testes focados em matemática como Math-500 e GPQA Diamond
- Esses modelos também são oferecidos como Phi Silica, uma versão otimizada para NPU em PCs Copilot+, permitindo execução rápida e eficiente no ambiente Windows
- Disponíveis no Azure AI Foundry e no HuggingFace:
- APIs para desenvolvedores e ferramentas de integração local também são fornecidas, facilitando a adoção em diferentes ambientes
Ainda não há comentários.