2 pontos por minodevs 13 일 전 | 1 comentários | Compartilhar no WhatsApp

A Anthropic lançou seu modelo flagship, Claude Opus 4.7.

  • 87,6% no SWE-bench Verified (+6,8 pp) e 64,3% no SWE-bench Pro, ficando em 1º lugar à frente do GPT-5.4 (57,7%)
  • Alcançou 94,2% no GPQA Diamond, 69,4% no Terminal-Bench 2.0 e 64,4% no Finance Agent
  • Melhora de 13% em benchmarks de coding em relação ao Opus 4.6, com taxa de resolução de tarefas de produção 3 vezes maior
  • Novo recurso de autoverificação (Self-Verification): projeta e executa por conta própria uma etapa de verificação antes de concluir a tarefa
  • Visão em alta resolução 3,3x maior (até 2.576 px), com novo tokenizer
  • Adicionado o nível de esforço xhigh, com melhora de 14% em raciocínio agentic e redução de erros de ferramentas para 1/3
  • O preço é o mesmo do Opus 4.6 ($5/$25 por MTok)
  • A própria Anthropic reconheceu que o desempenho é inferior ao do modelo fechado Mythos

Também está disponível no Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry.

1 comentários

 
runai 12 일 전

OPUS 4.7 > GPT 5.4 > OPUS 4.6