2 pontos por GN⁺ 2025-08-13 | Ainda não há comentários. | Compartilhar no WhatsApp
  • O Claude Sonnet 4 da Anthropic agora oferece contexto de até 1 milhão de tokens, permitindo processar grandes bases de código ou vários documentos de uma só vez
  • Com o suporte de contexto ampliado, passam a ser possíveis vários usos, como análise de código em larga escala, processamento de grandes conjuntos de documentos e desenvolvimento de agentes que mantêm o contexto
  • No caso de prompts que ultrapassam 200 mil tokens, há aumento no preço da API, e é possível reduzir custos com cache de prompt e processamento em lote
  • Clientes reais como Bolt.new e iGent AI aumentaram significativamente a produtividade e os recursos de IA com essa funcionalidade
  • No momento, o suporte a contexto longo do Sonnet 4 está disponível em beta na Anthropic API e Amazon Bedrock, com lançamento em breve também no Google Cloud

Suporte a contexto de 1 milhão de tokens

  • O Claude Sonnet 4 via Anthropic API agora oferece suporte a até 1 milhão de tokens de contexto
  • Com isso, passa a ser possível processar de forma integrada, em uma única solicitação, mais de 75.000 linhas de código ou vários artigos de pesquisa
  • O recurso beta de contexto de 1 milhão de tokens já está disponível na Anthropic API e no Amazon Bedrock, e o Vertex AI do Google Cloud também deve receber suporte em breve

Contexto mais longo, casos de uso ampliados

  • Análise de código em larga escala: é possível carregar de uma vez toda a base de código (incluindo arquivos-fonte, testes e documentação), entender a estrutura do projeto, identificar relações entre arquivos e propor melhorias de código com base no design do sistema
  • Resumo integrado de documentos: é possível analisar em lote centenas de contratos jurídicos, artigos acadêmicos e especificações técnicas, extraindo insights abrangentes enquanto se preservam as relações entre os documentos
  • Agentes com manutenção de contexto: mesmo em processos com centenas de chamadas de ferramentas e fluxos de trabalho em múltiplas etapas, é possível desenvolver agentes conversacionais que mantêm um estado consistente ao incluir toda a documentação da API, definições de ferramentas e histórico de interações

Política de preços da API

  • Prompts com até 200 mil tokens: entrada de US$ 3 por milhão de tokens, saída de US$ 15 por milhão de tokens
  • Prompts com mais de 200 mil tokens: entrada de US$ 6 por milhão de tokens, saída de US$ 22,5 por milhão de tokens
  • Ao aplicar cache de prompt, é possível reduzir a latência e os custos
  • Ao combinar o contexto de 1 milhão de tokens com processamento em lote, é possível obter até 50% de economia adicional

Casos de uso de clientes

  • Bolt.new

    • A Bolt.new está inovando no desenvolvimento web ao integrar o Claude à sua plataforma de desenvolvimento baseada na web
    • "Com a janela de contexto de 1 milhão do Sonnet 4, os desenvolvedores agora conseguem lidar com projetos maiores com alta precisão"
  • iGent AI

    • A iGent AI, sediada em Londres, no Reino Unido, converte conversas em código executável por meio do parceiro de IA chamado Maestro
    • "Recursos de engenharia de software autônoma que antes eram impossíveis agora se tornam viáveis com o contexto de 1 milhão de tokens do Sonnet 4, permitindo operar sessões por vários dias sobre bases de código reais"

Como usar e próximos passos

  • O recurso de contexto longo está disponível em beta para clientes Tier 4 e de planos personalizados da Anthropic API, com expansão para um grupo maior de usuários nas próximas semanas
  • O suporte também já está disponível no Amazon Bedrock, e o suporte no Google Cloud Vertex AI deve chegar em breve
  • Há planos para introduzir contexto longo em outros produtos da família Claude
  • Mais informações podem ser consultadas na documentação oficial e na página de preços

Ainda não há comentários.

Ainda não há comentários.