2 pontos por GN⁺ 2025-12-03 | 3 comentários | Compartilhar no WhatsApp
  • A OpenAI, para melhorar a qualidade do ChatGPT, acionou o estágio máximo de emergência “código vermelho”, em uma tentativa de recuperar a vantagem abalada com a corrida da Google
  • Hoje, é urgente reforçar recursos centrais como personalização, velocidade, confiabilidade e expansão do alcance das perguntas, e para isso todos os projetos novos — como publicidade, Pulse, agente de saúde e agente de compras — foram interrompidos ou adiados
  • O fato de o Gemini 3 da Google ter superado os modelos da OpenAI em diversas benchmarks recentemente, somado ao sucesso do modelo de imagem Nano Banana — que levou a MAU de 450 milhões para 650 milhões — aparece como a principal ameaça
  • A OpenAI também enfrenta pressão financeira crescente com compromissos de investimento em data centers na casa de centenas de bilhões de dólares, necessidade de aproximadamente US$ 200 bilhões de receita anual até 2030, e o crescimento dos clientes corporativos da Anthropic também pesando na competição
  • A OpenAI colocou em operação um sistema de revisão diária, realocou equipes e, internamente, afirmou que o novo modelo de raciocínio que será lançado em breve já está à frente da versão mais recente do Gemini, destacando a recuperação da liderança como um ponto crítico de virada

Ativação do Código Vermelho e plano de melhoria do ChatGPT

  • Foi revelado por um memorando interno que a OpenAI acionou o “código vermelho”, o modo mais alto de emergência, para corrigir os problemas do ChatGPT
    • A OpenAI usa um esquema de alerta de 3 níveis (yellow → orange → red) e esta ação elevou o nível em um passo acima do código laranja
  • O escopo de melhoria inclui fortalecer a personalização, aumentar a velocidade de resposta, melhorar a confiabilidade do servidor e ampliar o leque de perguntas que podem receber resposta, cobrindo a experiência geral do usuário
  • Por isso, todos os projetos novos, como anúncios, Pulse (assistente pessoal), agente de saúde e agente de compras, foram empurrados para um segundo plano
    • A empresa vai incentivar a realocação de pessoal em toda a organização e operar uma daily call dedicada para acompanhar diariamente o andamento do desenvolvimento
  • Houve reclamações recentes sobre o tom frio e erros em perguntas básicas no GPT-5, e isso incluiu reajustes no tom do modelo e na capacidade de execução de instruções

Perseguição do Google Gemini e pressão competitiva

  • O modelo mais recente da Google, Gemini 3, vem superando a OpenAI em vários benchmarks de indústria, deixando o cenário competitivo claramente abalado
    • As ações da Google subiram após o anúncio do Gemini, e o desempenho ganhou forte destaque no mercado
  • Desde o lançamento do modelo de imagem Nano Banana, os dados mostram que a MAU da Google AI
    • saltou de 450 milhões em julho para 650 milhões em outubro
  • A Anthropic também está ampliando sua base de clientes corporativos, revelando uma dinâmica em que a vantagem de uma OpenAI isolada perde força
  • O texto descreve como irônico que o “código vermelho” que a Google havia anunciado logo após o lançamento do ChatGPT agora tenha voltado para o lado da OpenAI

Pressão financeira, investimentos e incerteza de mercado

  • A OpenAI fechou contratos de energia de 36 GW com Microsoft e Amazon para data centers,
    • o que pode gerar custos anuais de aluguel de data centers em torno de US$ 620 bilhões
  • Há uma previsão interna de que seriam necessários cerca de US$ 200 bilhões de receita anual até 2030 para atingir lucro líquido
  • Embora a OpenAI não tenha planos de IPO,
    • essa estrutura financeira está fortemente interligada ao mercado de ações de gigantes de tecnologia como Nvidia, Oracle e Microsoft, com impacto no mercado como um todo
  • A OpenAI ainda está no vermelho e é vista como uma organização cuja sobrevivência se torna difícil sem captação contínua de recursos em grande escala

Anúncio de novo modelo e confiança interna

  • Altman afirmou no memorando que o novo modelo de raciocínio que será lançado na próxima semana está à frente da versão mais recente do Google Gemini
    • Isso parece um elemento para elevar o moral interno e enfatiza a ambição de crescimento e recuperação de liderança do ChatGPT
  • O ChatGPT ainda tem mais de 800 milhões de usuários semanais,
    • e a OpenAI pretende manter esse crescimento acrescentando melhorias de velocidade, precisão e personalização

Contexto geral

  • Com a intensificação da concorrência (Google e Anthropic), das controvérsias de qualidade do produto e dos custos massivos de infraestrutura,
    restaurar a qualidade-base do ChatGPT aparece como estratégia de sobrevivência da OpenAI e sua prioridade mais urgente

3 comentários

 
slowandsnow 2025-12-04

problemas do ChatGPT
Tem bugs demais. Você aperta enviar e a mensagem não é gerada, ou aparece um erro durante o streaming da mensagem e tudo some, entre outras coisas. O Deep Research tem ainda menos fontes do que o modo de raciocínio. Não há mais motivo para usar o Deep Research
problemas do Codex
É lento demais. Uma tarefa que no Claude Code levaria 5 minutos no Codex demora mais de 10 minutos. É burro demais

 
yinn27 2025-12-04

Mas o Gemini não é, no geral, mais incômodo de usar do que o ChatGPT, inclusive na UI..?

 
GN⁺ 2025-12-03
Comentários do Hacker News
  • Na semana passada, um cliente enviou uma dúvida sobre uma funcionalidade que eu tinha escrito em parte. O engenheiro de suporte gerou a resposta com Claude, e mesmo tendo sido treinado com documentação interna e pública, produziu uma besteira plausível com muita confiança
    Enquanto eu explicava por que estava errado, outro engenheiro testou com Augment, e dessa vez ele soltou outra besteira diferente, também com toda a confiança. No fim, só trocamos emojis de choro, e eu vou continuar usando minha própria inteligência daqui para frente

    • Meu código leva 0,11 segundo, o código do Gemini leva 0,5 segundo. Meu chefe pergunta por quê, e eu não faço ideia de como explicar ¯\(ツ)
    • LLMs são realmente fracos quando se trata de coisas impossíveis. Às vezes é melhor implementar de verdade a funcionalidade que eles alucinaram. Alguns provedores de API pública já estão fazendo isso
  • Ouvi rumores de que a OpenAI não conseguiu fazer um pre-training bem-sucedido desde meados de 2024. Se você perguntar ao ChatGPT 5.1 sobre eventos atuais sem internet, ele diz que o corte de conhecimento é junho de 2024. Não sei se isso é por causa de um modelo menor, mas, neste momento, 18 meses atrás parece um sinal preocupante

    • A mesma história apareceu na newsletter da SemiAnalysis e nunca foi desmentida
    • Quando tento programar com modelos GPT de vez em quando, o estilo de conversa conciso parece bom por alguns dias. Mas no fim a qualidade fica abaixo de Claude ou Gemini, e os padrões de falha também são mais frequentes
    • Perguntei ao ChatGPT 5.1 sobre um problema de instalação do codex CLI, e ele afirmou com confiança que o codex tinha sido descontinuado e que eu tinha usado o comando 'openai' errado
    • O Google também passou por problemas de atraso no rastreamento da web no começo dos anos 2000 e sobreviveu. Só que a OpenAI de hoje não está numa posição tão diferenciada quanto o Google daquela época, então a situação pode ser muito mais perigosa
    • Perguntei se deveria jogar Indiana Jones no PS5 ou no PC, e no começo ele achou que era erro de digitação; depois foi pesquisar na internet e elogiou minha liga de games
  • Parece que a saída de pesquisadores centrais da OpenAI, que vem acontecendo desde o ano passado, agora está começando a ter impacto de verdade. Sam Altman é um vendedor, não um pesquisador. Ilya também não está mais lá, e os principais talentos foram para Google, Meta e Anthropic ou abriram suas próprias empresas. Quem ficou é forte em melhoria iterativa, mas é duvidoso que consiga liderar por conta própria o próximo salto

  • A OpenAI de agora parece a Netscape. Inovadora, mas sem um modelo de receita sustentável. De um lado, o Google empacota IA de graça em produtos existentes; do outro, Deepseek e Qwen derrubam os preços com open source. No fim, ela está sendo pressionada pelos dois lados

    • Dizem que a OpenAI deve ultrapassar US$ 20 bilhões em receita anual este ano (artigo da CNBC)
    • Se a OpenAI fracassar na comercialização e voltar a um modelo sem fins lucrativos, compartilhando ferramentas gratuitas, estaria seguindo o caminho da Mozilla
    • Falam que “o Google vai empacotar o Gemini de graça”, mas não é mais ou menos isso que ele já faz em quase todos os produtos?
    • Minha esposa se recusa a mudar para o Claude. Ela sente que o ChatGPT foi perfeitamente ajustado ao gosto dela
    • Para empacotar o Gemini de graça, seria preciso baixar o custo de inferência do Flash 3.0 muito mais do que o do 2.5
  • Tenho uma dúvida sincera. Como a OpenAI pode falhar em pre-training? Eles já tiveram sucesso antes, têm gente de altíssimo nível; não seria só pegar o modelo de 2024 e treiná-lo de novo?

    • Pelo mesmo motivo que todo mundo falha. Você ajusta hiperparâmetros para o novo hardware, incorpora melhorias vistas em artigos, e depois de meses e milhões de dólares o loss entra em platô e o resultado é mínimo
    • Se “sucesso” significa desempenho visivelmente melhor que o do modelo anterior, então isso é realmente difícil
    • Ouvi dizer que o GPT-4.5 foi uma tentativa dessas. Só não foi lançado porque o desempenho não era suficiente
    • Modelos novos não continuam o treinamento dos anteriores. A arquitetura é completamente diferente. Desta vez, há uma boa chance de esse projeto ter dado errado e ficado pior que o modelo de meados de 2024
  • O “Code Red” que eu vivi normalmente era uma forma de maquiar uma empresa inteira sem rumo. A gerência intermediária não sabe o que fazer, então no fim os engenheiros é que assumem o peso

    • Demitir PMs e gerentes intermediários não evita esse tipo de situação. É uma visão simplista demais da estrutura de tomada de decisão de organizações grandes
    • Um Code Red de verdade deveria unificar as prioridades da empresa e redistribuir engenheiros para os projetos centrais
    • No único caso que eu vi, demitiram mesmo os PMs, surgiram problemas inesperados, e aceitaram isso com a postura de “que bom que agora sabemos dos problemas”
    • Também existe a ilusão do engenheiro de achar que “todos os problemas são culpa dos outros e tudo se resolve se só eu ficar”
    • Este Code Red também pode ser uma desculpa para suspender funcionalidades de monetização. Seria um movimento para evitar o descompasso com uma valuation realista
  • O verdadeiro Code Red não é o Google ter ultrapassado a OpenAI, mas o fato de ter ficado claro que não existe fosso defensável na indústria de IA. No fim, todo mundo está disputando a corrida mais cara até o fundo do poço

    • No fim, essas empresas vão socializar as perdas por meio de contratos governamentais ou resgates indiretos
    • Não está claro se o desempenho do Gemini 3 realmente levou usuários a abandonar o ChatGPT
    • Não entendo por que investidores ficam animados com uma competição de comoditização estruturalmente deficitária. Eu também era fã na época do GPT-3~4, mas hoje uso Claude e Gemini em paralelo. Minha lealdade é zero
    • Então por que as ações do Google dispararam depois do lançamento do Gemini 2.5 Pro?
    • Eu também achei que a OpenAI tivesse alguma tecnologia secreta de treinamento, mas não tinha nada disso
  • A OpenAI assumiu compromissos de gasto de longo prazo na casa de US$ 500 bilhões com o projeto Stargate e outros. Deve investir US$ 250 bilhões no Microsoft Azure e vários bilhões também em GPUs da AMD. A Oracle tomou US$ 18 bilhões em títulos e US$ 9,6 bilhões em empréstimos para isso
    Se a OpenAI ficar para trás, talvez não consiga bancar esses contratos, e surge o risco de uma sequência de calotes. Pode até haver intervenção do governo

    • Altman diz que não haverá resgate, mas essa própria fala é uma estratégia para passar confiança
    • US$ 500 bilhões são compromissos de gasto, não receita. É uma diferença enorme
    • Eu até preferiria que o impasse no Congresso impedisse esse tipo de resgate
    • A maior parte são LOIs não vinculantes, então não são compromissos tão firmes quanto parecem
    • Pode ser que a arquitetura de LLM não consiga chegar à AGI. Se uma estrutura alternativa não for desenvolvida, todos esses contratos podem perder o sentido
  • Dizem que a OpenAI vai adiar projetos como anúncios, compras, agentes de saúde e Pulse para focar em melhorar o ChatGPT, mas, no fundo, os talentos centrais são poucos e o restante pode cuidar de publicidade ou funcionalidades comerciais. As duas coisas não necessariamente entram em conflito

    • O gargalo não é pessoal, e sim a capacidade da liderança para pensar estrategicamente
    • O problema talvez não seja a qualidade do produto, mas a capacidade de construir ecossistema. O Google já está integrado às ferramentas do dia a dia
    • O avanço de LLMs se divide em duas camadas: ① arquitetura de baixo nível ② sistemas de aplicação e verificação. Esta última contribui para a melhoria do modelo central com geração automatizada de dados de validação
    • “Adiamento” pode não ser uma paralisação total, mas sim uma redistribuição de recursos computacionais
    • Do ponto de vista do consumidor, espero que essa competição leve a uma melhora na qualidade dos modelos
  • Segundo o WSJ, a OpenAI está adiando publicidade, IA para saúde e compras, e o assistente pessoal Pulse. Somando isso à colaboração em hardware com Jony Ive, dá a sensação de foco disperso

    • Além disso, ela também anunciou projetos como rede social e navegador
    • Para competir com o Google, o mais importante é entrar no mercado de anúncios. Caso contrário, os orçamentos de publicidade vão continuar indo para Meta, Amazon e Google
    • No fim, anúncios e assistentes no estilo Siri/Alexa são o núcleo, então é estranho adiar isso
    • Não é só que ela perdeu o foco; agora virou uma empresa voltada a resultado de curto prazo. É difícil vencer um rival como o Google, que joga esse jogo há 25 anos. Só expandir para hardware tem limite
    • Na verdade, a questão não é competir com o Google, e sim que a publicidade é a prova de sobrevivência da OpenAI.
      Se anúncios derem dinheiro, a OpenAI vira uma empresa nível Mag 7; se fracassar, a realidade aparece.
      Se os resultados iniciais dos testes de anúncios já estiverem abaixo do esperado, o ‘Code Red’ pode ser um sinal para ganhar tempo e esconder isso.
      O ChatGPT não é uma porta de entrada de busca como o Google, nem permite anúncios baseados em feed como a Meta.
      No fim, há uma grande chance de repetir o fracasso da Alexa.