1 pontos por flyingsquirrel 4 시간 전 | Ainda não há comentários. | Compartilhar no WhatsApp

A Anthropic lançou Claude Opus 4.8, uma versão atualizada do seu modelo topo de linha Claude Opus. Com base na versão anterior, 4.7, ele melhora o desempenho em benchmarks e reforça a capacidade de colaboração, mantendo o mesmo preço.

Principais melhorias e características

  • Melhoria de desempenho: apresenta desempenho superior ao modelo anterior e a modelos concorrentes, como o GPT-5.5, em tarefas de programação, habilidades de agente, raciocínio e conhecimento prático.
  • Reforço da honestidade (Honesty): foram melhorados os problemas em que a IA fazia afirmações sem fundamento ou chegava a conclusões precipitadas. O Opus 4.8 sinaliza por conta própria partes incertas, e a probabilidade de deixar passar falhas no código caiu cerca de 4 vezes em relação ao modelo anterior.
  • Capacidades de agente confiáveis: segundo os testes iniciais, ele ficou mais criterioso ao executar tarefas complexas de múltiplas etapas, mostrando melhor colaboração ao identificar os próprios erros e contestar planos quando eles não são válidos.
  • Eficiência de custo: a velocidade do 'Fast Mode' ficou 2,5 vezes maior, e o custo ficou 3 vezes mais barato em comparação com o modelo anterior.

Novos recursos lançados junto

  • Dynamic Workflows: recurso em preview de pesquisa do Claude Code que permite executar centenas de subagentes em paralelo para realizar tarefas complexas, como migrações de grandes bases de código.
  • Effort Control: permite que o usuário escolha o nível de esforço que o Claude deve dedicar à tarefa. Em níveis mais altos, ele pensa com mais profundidade para oferecer respostas de maior qualidade; em níveis mais baixos, responde mais rápido.
  • Atualização da Messages API: agora é possível incluir entradas de sistema dentro do array de mensagens, permitindo atualizar instruções no meio da tarefa sem quebrar o cache de prompt.

Próximos planos

A Anthropic está desenvolvendo um modelo que oferece desempenho de nível Opus a um custo mais baixo e, por meio do Project Glasswing, prepara uma nova classe de modelos com inteligência superior à do Opus (Claude Mythos). No momento, ele está em testes de segurança com algumas organizações e deve ser disponibilizado a todos os clientes dentro de algumas semanas.

Preços e disponibilidade

  • Modo normal: entrada $5 / 1M tokens, saída $25 / 1M tokens (igual ao Opus 4.7)
  • Fast Mode: entrada $10 / 1M tokens, saída $50 / 1M tokens
  • Nome do modelo: claude-opus-4-8

Ainda não há comentários.

Ainda não há comentários.