7 pontos por immutable000 2026-03-14 | 6 comentários | Compartilhar no WhatsApp
  • Aplicação padrão: para usuários Max, Team e Enterprise, o contexto de 1M é ativado automaticamente no Opus 4.6
  • Sem custo adicional: uma requisição de 900K tokens tem o mesmo preço por token que uma de 9K
  • Sem limite de throughput: mesmo com contexto mais longo, o mesmo throughput da conta é mantido, sem redução de rate limit
  • Não é necessário enviar beta header: requisições acima de 200K funcionam automaticamente, sem necessidade de alterar o código existente

6 comentários

 
neocode24 2026-03-15

Com certeza, quando chega a 1M, a compaction também não acontece com tanta frequência, o que é ótimo.

 
sea715 2026-03-16

Tanto o gpt5.4 quanto o Opus 4.6 não parecem muito bons usando 1M até o fim.. Acho que é melhor cortar e usar algo em torno de 700~800k

 
awbrg789 2026-03-15

Que bom..

 
princox 2026-03-15

"Sem custo adicional"

 
hulryung 2026-03-14

Mas, em compensação, a opção de 200K desapareceu.

 
immutable000 2026-03-14

Parece que é possível desativar isso com a opção CLAUDE_CODE_DISABLE_1M_CONTEXT.

Dê uma olhada em https://code.claude.com/docs/en/env-vars !