- O Claude Sonnet 4 da Anthropic agora oferece contexto de até 1 milhão de tokens, permitindo processar grandes bases de código ou vários documentos de uma só vez
- Com o suporte de contexto ampliado, passam a ser possíveis vários usos, como análise de código em larga escala, processamento de grandes conjuntos de documentos e desenvolvimento de agentes que mantêm o contexto
- No caso de prompts que ultrapassam 200 mil tokens, há aumento no preço da API, e é possível reduzir custos com cache de prompt e processamento em lote
- Clientes reais como Bolt.new e iGent AI aumentaram significativamente a produtividade e os recursos de IA com essa funcionalidade
- No momento, o suporte a contexto longo do Sonnet 4 está disponível em beta na Anthropic API e Amazon Bedrock, com lançamento em breve também no Google Cloud
Suporte a contexto de 1 milhão de tokens
- O Claude Sonnet 4 via Anthropic API agora oferece suporte a até 1 milhão de tokens de contexto
- Com isso, passa a ser possível processar de forma integrada, em uma única solicitação, mais de 75.000 linhas de código ou vários artigos de pesquisa
- O recurso beta de contexto de 1 milhão de tokens já está disponível na Anthropic API e no Amazon Bedrock, e o Vertex AI do Google Cloud também deve receber suporte em breve
Contexto mais longo, casos de uso ampliados
- Análise de código em larga escala: é possível carregar de uma vez toda a base de código (incluindo arquivos-fonte, testes e documentação), entender a estrutura do projeto, identificar relações entre arquivos e propor melhorias de código com base no design do sistema
- Resumo integrado de documentos: é possível analisar em lote centenas de contratos jurídicos, artigos acadêmicos e especificações técnicas, extraindo insights abrangentes enquanto se preservam as relações entre os documentos
- Agentes com manutenção de contexto: mesmo em processos com centenas de chamadas de ferramentas e fluxos de trabalho em múltiplas etapas, é possível desenvolver agentes conversacionais que mantêm um estado consistente ao incluir toda a documentação da API, definições de ferramentas e histórico de interações
Política de preços da API
- Prompts com até 200 mil tokens: entrada de US$ 3 por milhão de tokens, saída de US$ 15 por milhão de tokens
- Prompts com mais de 200 mil tokens: entrada de US$ 6 por milhão de tokens, saída de US$ 22,5 por milhão de tokens
- Ao aplicar cache de prompt, é possível reduzir a latência e os custos
- Ao combinar o contexto de 1 milhão de tokens com processamento em lote, é possível obter até 50% de economia adicional
Casos de uso de clientes
-
Bolt.new
- A Bolt.new está inovando no desenvolvimento web ao integrar o Claude à sua plataforma de desenvolvimento baseada na web
- "Com a janela de contexto de 1 milhão do Sonnet 4, os desenvolvedores agora conseguem lidar com projetos maiores com alta precisão"
-
iGent AI
- A iGent AI, sediada em Londres, no Reino Unido, converte conversas em código executável por meio do parceiro de IA chamado Maestro
- "Recursos de engenharia de software autônoma que antes eram impossíveis agora se tornam viáveis com o contexto de 1 milhão de tokens do Sonnet 4, permitindo operar sessões por vários dias sobre bases de código reais"
Como usar e próximos passos
- O recurso de contexto longo está disponível em beta para clientes Tier 4 e de planos personalizados da Anthropic API, com expansão para um grupo maior de usuários nas próximas semanas
- O suporte também já está disponível no Amazon Bedrock, e o suporte no Google Cloud Vertex AI deve chegar em breve
- Há planos para introduzir contexto longo em outros produtos da família Claude
- Mais informações podem ser consultadas na documentação oficial e na página de preços
Ainda não há comentários.