19 pontos por humblebee 2025-05-23 | 2 comentários | Compartilhar no WhatsApp

A Anthropic lançou a série Claude 4 em 23 de maio de 2025. Os modelos Claude Opus 4 e Claude Sonnet 4, anunciados desta vez, melhoram a capacidade de programação e de execução de tarefas de longa duração em relação às versões anteriores, com o preço mantido no mesmo nível.

  1. Capacidade de trabalho contínuo

    • 7 horas de trabalho contínuo: em uma refatoração open source validada pela Rakuten, realizou trabalho de forma independente por 7 horas
    • Processa tarefas complexas com milhares de etapas sem interrupção
    • Persistência em tarefas muito além dos limites dos agentes de IA existentes
  2. Sistema de memória aprimorado

    • Cria automaticamente arquivos de memória como 'Navigation Guide' para melhorar a percepção de contexto em trabalhos de longa duração
    • Uso prático da memória, como escrever por conta própria um guia de navegação durante uma partida de Pokémon
    • Redução de 65% no uso de atalhos/exploits em comparação com o modelo anterior
  3. Modelo de raciocínio híbrido

    • Modo de resposta imediata: para casos em que é necessário responder rapidamente
    • Modo de pensamento estendido: permite raciocínio aprofundado com até 64K tokens
    • Alterna automaticamente entre os dois modos conforme a situação
  4. Uso de ferramentas

    • Execução paralela de ferramentas: usa várias ferramentas ao mesmo tempo para aumentar a eficiência
    • Uso de ferramentas durante o raciocínio: utiliza busca na web etc. no processo de raciocínio para gerar respostas mais precisas
  5. Melhoria na qualidade do código

    • Avaliação da Block: "o primeiro modelo a melhorar a qualidade do código durante edição e depuração"
    • Relato da iGent: a taxa de erro na exploração de codebases caiu de 20% para quase 0%
    • Sourcegraph: qualidade de código mais elegante e compreensão mais profunda dos problemas
  6. Integração prática do Claude Code

    • Integração direta com IDE: alterações no código aparecem imediatamente no editor
    • Atendimento a PRs no GitHub: processa automaticamente feedback de revisores de PR e corrige erros de CI
    • Tarefas em segundo plano: suporte à automação via GitHub Actions
    • SDK escalável: desenvolvedores podem criar seus próprios agentes
  7. Novos recursos de API

    • Ferramenta de execução de código
    • Conectores MCP
    • Files API
    • Prompt caching de até 1 hora
  8. Segurança

    • Implementação de medidas de proteção ASL-3 (AI Safety Level 3)
    • Capacidade mais sofisticada de seguir instruções
    • Comportamento mais responsável, reduzindo a possibilidade de uso indevido

2 comentários

 
humblebee 2025-05-23

Diz que ele fez refatoração sem parar por 7 horas; se a qualidade for boa, dá até para imaginar um nível de trabalho terceirizado avançado em que o desenvolvedor deixa isso rodando depois de sair do trabalho e revisa no dia seguinte 😂

 
sinbumu 2025-05-23

Captaram esse ponto e lugares como o Google estão até testando em beta agentes de programação como o Jules... você joga uma tarefa para a IA e, em vez de ser na máquina local, ela vai fazendo tudo sozinha em um ambiente de nuvem, e depois você confere o resultado e manda fazer commit, deploy etc.