1 pontos por GN⁺ 12 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • No fluxo de respostas do ChatGPT, objetos de unidade de anúncio aparecem misturados à saída do modelo, e eventos delta do SSE entregam o formato single_advertiser_ad_unit
  • A imagem e o favicon dos cards de anúncio são carregados de bzrcdn.openai.com, e links com target.open_externally: false são abertos na webview interna do ChatGPT, mantendo no mesmo fluxo o clique e a navegação até a página do merchant
  • Mesmo na mesma conta, anunciantes diferentes aparecem conforme o tema da conversa; em contextos como viagem a Pequim, voos, playoffs da NBA, moda e produtividade, foram observados respectivamente Grubhub, GetYourGuide, Axel, Gametime, Aritzia e Canva
  • Nos anúncios e nas URLs de clique, identificadores baseados em token Fernet são enviados juntos, e ads_spam_integrity_payload, oppref, olref e ad_data_token são usados no fluxo de identificação e verificação de integridade do clique; oppref é salvo por 30 dias no cookie __oppref
  • A página do merchant carrega o SDK OAIQ e envia eventos measure para bzr.openai.com, completando um loop de atribuição no qual, após o clique no ChatGPT, os eventos do lado do merchant retornam ao OpenAI

Inserção de anúncios e fluxo de clique

  • No fluxo de respostas do ChatGPT, objetos de anúncio no formato single_advertiser_ad_unit aparecem misturados à saída do modelo
    • Ao fazer uma solicitação de conversa, é aberta uma resposta SSE em chatgpt.com/backend-api/f/conversation, e algumas mensagens delta entregam a unidade de anúncio
    • O objeto de anúncio inclui ads_request_id, ads_spam_integrity_payload, advertiser_brand, carousel_cards, ad_data_token e outros campos
    • advertiser_brand.id parece ser um identificador de conta do merchant no formato adacct_<32-hex>
  • O favicon da marca e as imagens dos cards de anúncio são todos carregados de bzrcdn.openai.com
    • Isso mostra uma estrutura em que o criativo do anúncio é hospedado pelo OpenAI, e não pelo merchant
  • Links com target.open_externally: false são abertos na webview interna do ChatGPT
    • Assim, o OpenAI também consegue observar diretamente o fluxo de navegação até a página do merchant após o clique
  • Nas URLs de clique, junto com parâmetros como utm_source=chatgptpilot, também são anexados oppref e olref

Cadeia de segmentação e atribuição

  • Mesmo na mesma conta, anunciantes diferentes são entregues de acordo com o tema da conversa
    • Em um planejamento de viagem a Pequim, apareceu o anúncio do Grubhub com "Get Chinese Food Delivered"
    • Em uma reserva de passeio em Pequim, apareceu o tour da Great Wall do GetYourGuide com ad_id=beijing003
    • Em voos para Pequim, apareceu Axel com utm_term=vflight_beijing_03
    • Nos playoffs da NBA, apareceu Gametime com utm_campaign=nba&utm_content=playoffs
    • Em conversas sobre moda e tendências de primavera, apareceu Aritzia com utm_campaign=chatgptpilot_trav3
    • Em conversas sobre produtividade e slides, apareceu Canva com utm_campaign=…link-clicks_products
  • Nessa observação, fica evidente a segmentação baseada no contexto da conversa
    • Não foi confirmado se o histórico de conversas anteriores também é levado em conta
  • Em cada anúncio, quatro tokens Fernet são enviados junto
    • ads_spam_integrity_payload aparece apenas dentro do SSE e foi caracterizado como um valor usado em verificações de integridade no servidor contra cliques forjados
    • oppref é anexado à URL de clique, e o SDK OAIQ o copia para o cookie __oppref com 720 horas, TTL de 30 dias
    • olref também é anexado à URL de clique junto com oppref, mas no SDK observado ele não é armazenado
    • ad_data_token tem uma estrutura em que outro token Fernet fica dentro de um JSON encapsulado em base64
  • Os primeiros 9 bytes de um token Fernet têm formato público, então o horário de emissão pode ser recuperado sem a chave
    • Eles incluem o byte de versão 0x80 e um timestamp Unix big-endian de 8 bytes
    • A URL de clique da Home Depot capturada foi emitida em 2026-04-26 11:30:08 UTC, e o horário em que o navegador buscou a página do merchant foi 11:31:43, resultando em um atraso de 95 segundos

SDK de rastreamento do lado do merchant

  • A página do merchant carrega o SDK OAIQ https://bzrcdn.openai.com/sdk/oaiq.min.js
    • A versão observada é 0.1.3
    • O código de inicialização entra no formato oaiq('init', { pid: '<merchant pixel ID>' });
    • A medição de página é chamada no formato oaiq('measure', 'contents_viewed', { ... });
  • No momento do init, o OAIQ lê o valor de ?oppref= da URL e o grava como cookie primário __oppref
    • Junto com isso, também define o cookie __oaiq_domain_probe
  • Depois disso, todas as chamadas measure fazem POST do JSON para https://bzr.openai.com/v1/sdk/…
    • Com isso, conclui-se o loop de atribuição em que os eventos do lado do merchant, após o clique, retornam ao OpenAI
  • Como alvos de bloqueio ou inspeção, dois domínios e dois cookies são apresentados diretamente
    • bzrcdn.openai.com,bzr.openai.com

      • __oppref, __oaiq_domain_probe

1 comentários

 
Opiniões do Hacker News
  • Sam Altman disse há menos de dois anos que publicidade seria um último recurso, então dá a impressão de que a OpenAI agora está oficializando que está precisando de dinheiro

    • Não, e acho que aquela expressão de último recurso já era, no fim das contas, uma espécie de linguagem dúbia indicando que anúncios acabariam entrando mesmo
      Ele parece mais o tipo de pessoa que escolhe as palavras para produzir o resultado desejado do que para dizer exatamente o que pensa, e aí verdade ou mentira parecem menos importantes
      Então interpretar literalmente "Sam Altman disse isso" não tem muito valor; para mim é quase o mesmo que "o ChatGPT disse isso"
    • Para mim isso parece um caso de idealismo virando realismo
      A OpenAI também pode seguir um caminho parecido com Google, Facebook e talvez Netflix, e as grandes empresas de tecnologia acabam sempre redescobrindo a velha fórmula da mídia: pessoas pagam mais facilmente com atenção do que com dinheiro
      Publicidade continua sendo um dos modelos de negócio mais poderosos, e não parece que isso vá mudar tão cedo
    • Acho que a direção já ficou clara quando anunciaram a conversão para empresa com fins lucrativos
      Parece papo de ladeira escorregadia, mas distribuir tokens grátis por anos provavelmente também é parte da causa do cenário atual
    • Os anúncios vão no tier gratuito e no novo plano com anúncios de 8 dólares
      A receita publicitária do tier gratuito em troca de algumas consultas limitadas ao GPT-5.3 é insignificante perto da receita de API e assinaturas, e isso parece mais uma tentativa de fazer o tier gratuito, que dava prejuízo, parecer algo próximo do neutro nos livros antes de um IPO
      O ponto central daquela citação era "todo mundo no mundo", e anúncios parecem ser a forma de manter acesso de baixo custo
    • Eu li aquela frase de um jeito totalmente diferente
      Em linguagem de VC, significa: "vamos oferecer um bom serviço para todo mundo no mundo; para isso, no fim, vamos precisar de monetização, e anúncios são a opção que eu escolheria por último, mas eu faria isso se fosse o único meio de atingir esse objetivo"
  • Quando vejo uma frase do tipo Abraham Lincoln foi o 16º presidente dos EUA, escreveu a Proclamação de Emancipação e também jogava RAID: Shadow Legends, imagino imediatamente um futuro em que mensagens de patrocinador se infiltram em descrições históricas

    • Parece que ele também teria tomado uma Coca-Cola bem gelada enquanto jogava
    • Isso realmente salvou meu dia
    • Fica ainda mais engraçado porque parece saída do ChatGPT
  • Dos anúncios que ainda vão chegar, curiosamente esse tipo me preocupa menos
    Vendo o quanto o Google luta há anos contra SEO, o problema maior vai ser quando empresas descobrirem como injetar anúncios dentro do modelo
    Ainda não parece que chegamos ao ponto em que conteúdo adversarial realmente funciona em larga escala

    • O modelo já faz algo parecido com anúncio
      Como os dados de treino incluem uma enorme quantidade de menções a grandes marcas, se você pedir recomendação de tênis novos ele provavelmente vai pensar antes em Nike ou Adidas do que em marcas pequenas e desconhecidas
    • Duas pessoas entraram em contato comigo por causa de um dos meus serviços, e ambas disseram que vieram por recomendação do ChatGPT
      Esse serviço era uma ferramenta pequena que fiz para um cliente anos atrás e transformei num site mantendo os direitos; cheguei a rodar Google Ads por um tempo, mas ele mal aparecia nas buscas e não trouxe clientes extras, então eu praticamente tinha esquecido dele
      Aí, em algum momento, o ChatGPT começou a recomendá-lo
      Fico curioso sobre o que eu fiz para isso acontecer
      Talvez uma página de negócio feita com vibe coding tenha entrado nos dados de treino
    • Vendo pelo lado positivo, LLMs basicamente seguem dados reais, então por padrão tendem a responder na direção que os dados mostram
      Empresas vão tentar influenciar isso, mas precisariam de esforço extra contra o conjunto inteiro de dados, algo parecido com tentar censurar temas sensíveis
      Além disso, quanto mais contexto publicitário você coloca, menos contexto do usuário sobra e menor fica a utilidade da ferramenta
    • O que me preocupa mais do que injeções escondidas estilo truques de SEO é promoção sutil com aprovação da OpenAI
      Parece mais realista a IA favorecer naturalmente produtos ou mensagens de quem paga, ou reduzir menções a concorrentes; e mesmo sem receber dinheiro, a própria empresa pode decidir promover ou censurar por conta própria
      Para o usuário isso nem vai parecer anúncio, e é isso que normalmente acontece quando gente gananciosa controla os caminhos de acesso à informação
    • Se pensar no momento em que anúncios forem enfiados em todo lugar para onde o olhar vai, dá até para dizer que isso já era adversarial desde o começo
  • É bem assustador imaginar pessoas como Sam Altman usando modelos de fronteira sem restrições, enquanto o público em geral recebe estratégias de longo prazo que talvez nem perceba quando começam
    O modelo para o público pode acabar sendo uma versão mais censurada, enquanto eles usam outra coisa

    • Seria engraçado se descobrissem que a estratégia errática da OpenAI até hoje na verdade foi resultado de conselhos do ChatGPT
    • Mais assustador que isso talvez seja o AI slop por trás do Claude Code
  • Os anúncios só entram no tier gratuito e no novo plano Go de 8 dólares por mês
    Toda vez que esse assunto aparece, as pessoas presumem que anúncios vão se misturar também às respostas dos planos pagos comuns, mas o anúncio atual é sobre planos gratuito/baixo custo que já deixam explícita a presença de anúncios na contratação

    • TV a cabo também começou sem anúncios, e a Netflix também
      Empresas no fim não conseguem resistir à publicidade
    • A distinção entre plano grátis/barato/caro não é o ponto principal aqui
      A questão é o próprio fato de que há anúncios dentro das respostas de LLM, e em qual tier isso acontece é secundário
    • Para implementar anúncios misturados de forma natural na conversa, sem ficar óbvio e sem estragar o resultado, não seria necessário bastante treinamento?
    • Quando chegar a divulgação de resultados do próximo trimestre, anúncios podem acabar se espalhando até para planos mais caros como se fossem um recurso
  • Se os anúncios continuarem sendo servidos como evento separado, parece que vai ser fácil bloqueá-los
    A parte realmente interessante começa quando forem injetados diretamente na resposta principal

    • Quando esse estágio chegar, provavelmente vai aparecer um segundo pós-processamento com LLM para remover os anúncios da resposta
    • Dá para bloquear estas URLs: |bzrcdn.openai.com^, ||bzr.openai.com^
      Não vai bloquear tudo, mas pelo menos reduz bastante a coleta de telemetria
    • Talvez não seja uma boa ideia bloquear anúncios transparentes e visíveis
      Porque aí a alternativa pode ser acabar consumindo anúncios opacos
  • Dizem que "anúncios não afetam as respostas", mas eles vêm no mesmo payload e são medidos com quatro camadas de atribuição, como se fosse coincidência
    Parece uma espécie de monetização à la Schrödinger: totalmente separada, mas sempre presente em algum lugar

    • Fico curioso para ver que tipo de otimização vai surgir disso
      Mesmo que ainda não estejam distorcendo respostas diretamente para combinar com anúncios específicos, dá para empurrar o modelo de forma geral para respostas mais amigáveis à publicidade
  • Eu sempre achei que anúncios no ChatGPT não seriam distinguíveis do conteúdo real

    • No fim, acho que esse também é o destino que eles querem
      Muita gente imagina que, no longo prazo, qualquer um vai poder comprar algo parecido com ad words para inclinar respostas de LLM para o próprio lado
      Só que, por enquanto, a possibilidade de trocar de modelo ainda parece grande demais, então o fosso defensável ainda depende de marca, e eles talvez ainda não estejam prontos para empurrar tudo de forma totalmente Black Mirror
    • Isso seria uma clara quebra de confiança, e mesmo que funcionasse no curto prazo, o dano no longo prazo seria grande demais
      Claro, também dava para dizer algo parecido sobre resultados de busca, então nem aquilo dá para tratar como totalmente seguro
    • Eu trabalho numa empresa que ganha dinheiro com anúncios, e não tenho dúvida de que o objetivo final é fazer a publicidade parecer conteúdo natural para que não dê para distinguir
      Normalmente esse tipo de abordagem melhora métricas de A/B, e propaganda com influenciadores funciona justamente porque parece mais orgânica
    • Também lembro de quando todo mundo ficou irritado porque o Google disse que colocaria anúncios na busca de imagens
      [1] http://www.ryanspoon.com/blog/2008/12/14/google-image-search... 2008
    • O alarmismo até aqui foi um pouco exagerado
      É difícil para anunciantes colocar preço em algo como "a IA te mencionou discretamente uma vez", e nem toda conversa precisa de anúncio
      Se o ChatGPT começar a enfiar marcas até nas perguntas mais simples, todo mundo vai odiar isso; como tecnologia de anúncios já é uma área antiga, o mais provável é que acabem usando abordagens comprovadas como inserção de blocos patrocinados
  • Essa também é uma das velhas lições
    Quase todo plano de negócio de tecnologia acaba escorrendo para servir anúncios, ou pelo menos tende a isso enquanto não proibirem pixels e rastreamento de terceiros

    • Não sei se isso é sempre verdade
      A estrada para o sonho está cheia de negócios baseados em publicidade que fracassaram ou seguiram a direção errada, e há casos que quebram justamente por desprezar o próprio modelo de negócio
      A suposição implícita de que basta ter tráfego e disposição para sujar o produto para dar certo costuma falhar
      Casos de sucesso são poucos, e geralmente exigem execução muito intencional e persistente, além de posicionamento, dados, intenção e escala
      No caso de anúncios em busca, só o Google teve escala de Google; ter 5% a 10% do mercado não bastou
      Rastreamento ajuda, mas mesmo com segmentação fraca a busca já traz intent embutido por natureza, o que compensa um pouco
      Ainda assim, a escala necessária para isso funcionar é enorme
      Os anúncios do Facebook também só funcionaram depois que levaram a segmentação ao extremo e atingiram grande escala; lugares como Bing ou reddit não conseguiram construir um grande negócio de anúncios
  • A OpenAI provavelmente conseguiria ganhar muito mais dinheiro com contratos de defesa do que enfiando anúncios no chat, então fico me perguntando de quem foi a ideia de assumir esse risco de percepção pública

    • Todo MBA consegue mostrar alguma alta de receita por pelo menos um trimestre depois de introduzir anúncios
      O que acontece depois muitas vezes pouco importa, desde que a pessoa possa usar aquele número na própria carreira
    • É otimista demais acreditar que uma empresa vai fazer só uma coisa suspeita por dinheiro e parar por aí
      Sem mecanismos para impedir, o mais provável é que façam as duas coisas
    • Talvez tenham decidido que ser criticados por anúncios é melhor do que ser criticados por alimentar murderbots