- Aplicação padrão: para usuários Max, Team e Enterprise, o contexto de 1M é ativado automaticamente no Opus 4.6
- Sem custo adicional: uma requisição de 900K tokens tem o mesmo preço por token que uma de 9K
- Sem limite de throughput: mesmo com contexto mais longo, o mesmo throughput da conta é mantido, sem redução de rate limit
- Não é necessário enviar beta header: requisições acima de 200K funcionam automaticamente, sem necessidade de alterar o código existente
6 comentários
Com certeza, quando chega a 1M, a compaction também não acontece com tanta frequência, o que é ótimo.
Tanto o gpt5.4 quanto o Opus 4.6 não parecem muito bons usando 1M até o fim.. Acho que é melhor cortar e usar algo em torno de 700~800k
Que bom..
"Sem custo adicional"
Mas, em compensação, a opção de 200K desapareceu.
Parece que é possível desativar isso com a opção
CLAUDE_CODE_DISABLE_1M_CONTEXT.Dê uma olhada em https://code.claude.com/docs/en/env-vars !