Anthropic lança Claude Opus 4.7 - autoverificação, visão em alta resolução 3,3x maior e 13% de melhora em coding
(anthropic.com)A Anthropic lançou seu modelo flagship, Claude Opus 4.7.
- 87,6% no SWE-bench Verified (+6,8 pp) e 64,3% no SWE-bench Pro, ficando em 1º lugar à frente do GPT-5.4 (57,7%)
- Alcançou 94,2% no GPQA Diamond, 69,4% no Terminal-Bench 2.0 e 64,4% no Finance Agent
- Melhora de 13% em benchmarks de coding em relação ao Opus 4.6, com taxa de resolução de tarefas de produção 3 vezes maior
- Novo recurso de autoverificação (Self-Verification): projeta e executa por conta própria uma etapa de verificação antes de concluir a tarefa
- Visão em alta resolução 3,3x maior (até 2.576 px), com novo tokenizer
- Adicionado o nível de esforço xhigh, com melhora de 14% em raciocínio agentic e redução de erros de ferramentas para 1/3
- O preço é o mesmo do Opus 4.6 ($5/$25 por MTok)
- A própria Anthropic reconheceu que o desempenho é inferior ao do modelo fechado Mythos
Também está disponível no Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.
1 comentários
OPUS 4.7 > GPT 5.4 > OPUS 4.6