- Qualidade geral para programação: GPT 5.2 > GPT 5.1 >>> Sonnet 4.5 >> GEMINI 3 Pro
- A linha ChatGPT 5 tem, durante a programação, muito menos alucinação e perda de contexto do que as concorrentes. O 5.2 teve aumento de preço de 40% em relação ao 5.1
- O Claude Sonnet 4.5 não tem cache automático, o que cria uma grande armadilha em toda a estrutura de preços. Recomenda-se usar algo como duas contas de $20
- O Google Gemini 3 Pro é um senhor com demência vestido de terno. O cache automático é aplicado, então não há armadilha no plano. Porém, o consumo de tokens é de 10 a 20 vezes maior que o de outros modelos
- O Gemini 3, que tem ganhado muita popularidade, é o modelo com mais alucinações
9 comentários
Quando vejo esse tipo de coisa, eu simplesmente penso na importância do prompt de sistema da ferramenta. Hoje, ao usar no Cursor, pessoalmente acho que
opus >= gpt 5.2 > gemini 3. Fora isso, Sonnet, 5.1 e tal... pessoalmente, não uso mais. Só que... nogpt5.2, a diferença entre os níveis de effort é bem grande... mas nem sempre effort alto é melhor. Então acabo usando mais o Opus e o Gemini como principais. Quando encontro algum problema mais cabeludo, faço os três programarem, peço para avaliarem o código uns dos outros, e depois eu mesmo confiro e aplico.Assinei o ChatGPT pago e estou rodando o Opus no Antigravity. O Code é lento demais e não dá para usar. O que o Claude faz em 5 minutos leva uns 10. O uso de ferramentas no Claude Code é muito superior ao Codex ou ao Gemini CLI.
Qual é melhor: o opus no Antigravity ou o opus no Claude Code?
A pegadinha é que o Opus 4.5 nem foi mencionado.
Mas, se já não houver uma diferença de desempenho esmagadora, a configuração dá tanto trabalho que a gente acaba nem trocando mais...
Não tem algo como o Opus ou o Codex Max...
Não entendi muito bem o que você quer dizer com não haver cache automático... Você quer dizer que o cache não é configurado no Claude Code, ou que você está usando a API diretamente por conta própria...?
Com certeza, usando o Gemini 3 eu também senti muitas vezes que ele perdia o contexto com frequência (ou perdia de propósito para economizar tokens).
Do ponto de vista de aplicação, sou mais uma pessoa que não consegue entender por que dizem que o desempenho do Gemini 3 é bom..
Mas em geração de imagens ele é absurdo..
Não tem o Claude Opus 4.5.