Anthropic lança Claude Opus 4.8
(anthropic.com)A Anthropic lançou Claude Opus 4.8, uma versão atualizada do seu modelo topo de linha Claude Opus. Com base na versão anterior, 4.7, ele melhora o desempenho em benchmarks e reforça a capacidade de colaboração, mantendo o mesmo preço.
Principais melhorias e características
- Melhoria de desempenho: apresenta desempenho superior ao modelo anterior e a modelos concorrentes, como o GPT-5.5, em tarefas de programação, habilidades de agente, raciocínio e conhecimento prático.
- Reforço da honestidade (Honesty): foram melhorados os problemas em que a IA fazia afirmações sem fundamento ou chegava a conclusões precipitadas. O Opus 4.8 sinaliza por conta própria partes incertas, e a probabilidade de deixar passar falhas no código caiu cerca de 4 vezes em relação ao modelo anterior.
- Capacidades de agente confiáveis: segundo os testes iniciais, ele ficou mais criterioso ao executar tarefas complexas de múltiplas etapas, mostrando melhor colaboração ao identificar os próprios erros e contestar planos quando eles não são válidos.
- Eficiência de custo: a velocidade do 'Fast Mode' ficou 2,5 vezes maior, e o custo ficou 3 vezes mais barato em comparação com o modelo anterior.
Novos recursos lançados junto
- Dynamic Workflows: recurso em preview de pesquisa do Claude Code que permite executar centenas de subagentes em paralelo para realizar tarefas complexas, como migrações de grandes bases de código.
- Effort Control: permite que o usuário escolha o nível de esforço que o Claude deve dedicar à tarefa. Em níveis mais altos, ele pensa com mais profundidade para oferecer respostas de maior qualidade; em níveis mais baixos, responde mais rápido.
- Atualização da Messages API: agora é possível incluir entradas de sistema dentro do array de mensagens, permitindo atualizar instruções no meio da tarefa sem quebrar o cache de prompt.
Próximos planos
A Anthropic está desenvolvendo um modelo que oferece desempenho de nível Opus a um custo mais baixo e, por meio do Project Glasswing, prepara uma nova classe de modelos com inteligência superior à do Opus (Claude Mythos). No momento, ele está em testes de segurança com algumas organizações e deve ser disponibilizado a todos os clientes dentro de algumas semanas.
Preços e disponibilidade
- Modo normal: entrada $5 / 1M tokens, saída $25 / 1M tokens (igual ao Opus 4.7)
- Fast Mode: entrada $10 / 1M tokens, saída $50 / 1M tokens
- Nome do modelo:
claude-opus-4-8
Ainda não há comentários.