2 pontos por GN⁺ 2 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • A OpenAI está reforçando um modelo de procedência em camadas que combina conformidade com a C2PA, marca d'água SynthID e uma ferramenta pública de verificação para identificar conteúdo gerado por IA
  • A C2PA transporta junto o contexto de criação e edição do conteúdo com metadados e assinaturas criptográficas, mas isso pode ser danificado durante processos de transformação
  • O SynthID do Google DeepMind adiciona uma marca d'água invisível a imagens geradas por ChatGPT, Codex e OpenAI API para compensar as limitações dos metadados
  • A prévia da ferramenta pública de verificação ajuda a determinar se uma imagem foi gerada pela OpenAI ao verificar Content Credentials e SynthID em imagens enviadas
  • Uma única tecnologia não é suficiente; o ecossistema de procedência fica mais forte ao combinar padrões comuns, marca d'água persistente e verificação pública

Fortalecendo a abordagem de procedência de conteúdo

  • A OpenAI está reforçando um modelo de procedência em camadas para construir confiança online e pretende aumentar a identificabilidade de conteúdo gerado por IA com base em padrões abertos e colaboração entre plataformas
  • Há três mudanças principais
    • Conformidade com a C2PA para ajudar outras ferramentas e plataformas a reconhecerem sinais de procedência com mais facilidade
    • Em colaboração com o Google, a adição de marca d'água SynthID às imagens
    • Uma prévia de ferramenta pública de verificação para que o público possa conferir se uma imagem foi gerada pela OpenAI
  • Sinais de procedência fornecem o contexto necessário para avaliar de onde o conteúdo veio, como foi gerado ou editado e se corresponde ao que afirma ser

Ecossistema de confiança com conformidade à C2PA

  • A OpenAI participa do desenvolvimento e da adoção de padrões de procedência desde 2024, e começou a adicionar Content Credentials a imagens geradas pelo DALL·E 3
  • Depois disso, Content Credentials também passaram a ser aplicadas ao ImageGen e ao Sora
  • A OpenAI entrou para o comitê diretor da Coalition for Content Provenance and Authenticity (C2PA), um grupo multissetorial que promove padrões tecnológicos abertos para procedência de conteúdo
  • A C2PA funciona usando metadados e assinaturas criptográficas para ajudar informações sobre a mídia a serem transportadas com segurança junto com o próprio conteúdo
  • Essas informações fornecem contexto para jornalistas que avaliam procedência, plataformas que tomam decisões relacionadas à integridade e pessoas que querem entender o conteúdo online
  • A OpenAI recentemente se tornou um produto gerador em conformidade com a C2PA
  • A conformidade com a C2PA serve de base para que plataformas possam ler, preservar e transmitir de forma confiável as informações de procedência anexadas ao conteúdo
  • As informações de procedência ganham mais valor quando são mantidas além da plataforma em que o conteúdo foi originalmente gerado, e a conformidade torna isso possível

Procedência de imagem em camadas com SynthID

  • Os metadados da C2PA são a base para transportar informações sobre de onde o conteúdo veio, como foi gerado ou editado e quem assinou essas informações
  • Metadados podem ser removidos, desaparecer em processos de upload e download ou ser danificados por transformações como mudança de formato de arquivo, redimensionamento e capturas de tela
  • Para tornar as informações de procedência mais robustas, a OpenAI está adotando uma marca d'água invisível por meio do SynthID do Google DeepMind
  • A aplicação começa primeiro com imagens geradas por ChatGPT, Codex e OpenAI API
  • O SynthID funciona como uma camada adicional de marca d'água que complementa a abordagem baseada em metadados da C2PA
  • A OpenAI já vinha testando abordagens de procedência e marca d'água em ambientes reais de implantação
    • O Sora usa marca d'água visível
    • O Voice Engine usa marca d'água em áudio
    • A empresa continua testando e pesquisando se a precisão e a confiabilidade se mantêm ao longo do tempo
  • C2PA e SynthID compensam fraquezas diferentes um do outro
    • A C2PA ajuda a incluir contexto detalhado no conteúdo, mas os metadados podem ser removidos ou danificados
    • O SynthID ajuda a preservar o sinal mesmo quando os metadados não são mantidos, e pode resistir por mais tempo a transformações como capturas de tela
    • Metadados fornecem mais informações do que uma marca d'água sozinha conseguiria oferecer
  • Usar as duas abordagens em conjunto torna a resiliência das informações de procedência do conteúdo maior do que ao usar cada uma isoladamente

Prévia da ferramenta pública de verificação

  • A OpenAI está oferecendo em versão prévia uma ferramenta pública de verificação para ajudar a confirmar se uma imagem foi gerada pelo ChatGPT, pela OpenAI API ou pelo Codex
  • Essa ferramenta verifica se há sinais de procedência como Content Credentials e SynthID na imagem enviada
  • O objetivo é integrar vários sinais para ajudar usuários a verificar e interpretar com mais facilidade as informações de procedência do conteúdo
  • A ferramenta pública de verificação consegue detectar com confiabilidade marcas d'água SynthID originadas na OpenAI e, quando encontra metadados da C2PA, pode mostrá-los junto
  • Como nenhum método de detecção é perfeito, ela não tira conclusões definitivas quando a detecção falha
    • Mesmo que metadados ou marca d'água não sejam detectados, isso não significa necessariamente que a imagem não foi gerada com ferramentas da OpenAI
    • Sinais de procedência podem ser removidos em alguns casos
  • No lançamento, a ferramenta de verificação fica limitada a conteúdo gerado pela OpenAI
  • O objetivo é apoiar, nos próximos meses, esforços multissetoriais que permitam verificação em plataformas de forma mais ampla
  • Com o tempo, espera-se que ela também ofereça suporte a mais tipos de conteúdo encontrados online

Próximos desafios

  • Uma única tecnologia de procedência não é suficiente
  • Uma abordagem forte de procedência precisa combinar padrões comuns, sinais de marca d'água duradouros e verificação pública
  • Com o suporte existente a Content Credentials, a conformidade com a C2PA, a adoção do SynthID e a prévia da ferramenta pública de verificação, a OpenAI quer contribuir para um ecossistema de procedência mais interoperável

1 comentários

 
GN⁺ 2 시간 전
Comentários do Hacker News
  • Se você fizer uma imagem de IA com fundo preto, o SynthID fica visível em um monitor decente. É só um padrão borrado repetitivo, nada de especial
    Consegui remover bem mascarando cada segundo pixel, regenerando os pixels faltantes e depois repetindo o processo com um deslocamento de 1 pixel, novamente mascarando cada segundo pixel
    Usei um modelo pronto para preencher os pixels, mas antes da alteração primeiro exportei o mapa de profundidade e reduzi o ruído para que os novos pixels mascarados combinassem com o conteúdo original. O resultado não ficou 100% perfeito, mas, com mais tempo e um modelo ajustado para esse uso, parece que daria para remover qualquer tipo de marca-d'água de IA sem grande dificuldade

    • É difícil acreditar que dê para remover uma marca-d'água de 0,5 bit que só carrega a informação de presença ou ausência. O que é visível provavelmente é só uma isca funcional
    • Não bastaria ampliar ou comprimir a imagem bem de leve?
    • É interessante que, com mais tempo e um modelo ajustado para uma finalidade específica, seria possível remover qualquer marca-d'água de IA sem grande dificuldade. Usar IA contra IA é sempre divertido
    • Com certeza dá para contornar. Alguns dos nossos engenheiros também lidaram com isso há muito tempo
      https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
  • Que tipo de informação entra nos metadados ou no SynthID? Quantos bits o SynthID consegue codificar?
    Será que daria para fazer uma espécie de tabela nutricional para conteúdo sintético? Algo como 10% de texto sintético, 30% de imagem sintética
    Hoje a sua realidade foi 15% sintética (75% big tech, 25% neocloud de pesos abertos)

    • O artigo do SynthID-Image de outubro de 2025[0] aparentemente era um codificador-decodificador que testava verificação de flag ou payload de 136 bits em imagens 512x512, e avaliava a robustez da marca-d'água após várias transformações
      A versão realmente implantada provavelmente deve ser bem diferente
      [0]:https://arxiv.org/html/2510.09263v1
    • Também daria para colocar ID de usuário ou uma impressão digital individual. Impressoras já fazem isso há muito tempo, e agora deve ficar fácil fazer o mesmo com toda foto e imagem gerada
    • Acho que isso não seria possível. Se você colar um fragmento sintético em uma imagem original, o SynthID não teria como saber disso
  • O SynthID parece estar completamente comprometido, mas a nova marca-d'água da OpenAI aparentemente ainda não, o que é interessante [1]
    [1] https://github.com/wiltodelta/remove-ai-watermarks

  • Isso é só teatro inútil
    Para quem cria coisas com ferramentas em várias mídias, eu simplesmente evitaria ferramentas assim, que inserem metadados arbitrários que eu não escolhi
    Estou criando texturas para videogame e tenho que colocar esse estranho resíduo de DRM? O Photoshop existe há tanto tempo, por que seria exceção?

    • O fato de não ser perfeito não significa que seja inútil. Já vi posts online em que alguém passou uma imagem pelo verificador do SynthID do Google e provou que era falsificada
      O Photoshop não foi feito pelo Google nem pela OpenAI, e a barreira de entrada para criar imagens realistas e enganosas com Photoshop é muito maior do que com IA. Já existem técnicas, ainda que imperfeitas, para detectar uso de edição de imagem tradicional
    • Acho que dá para pensar facilmente em vários fatores que diferenciam Photoshop de IA generativa
    • Tecnicamente, DRM é gestão de direitos digitais e está ligado a propriedade intelectual
      O SynthID só seria DRM se o Google ou a OpenAI estivessem reivindicando propriedade intelectual sobre suas próprias imagens, e eu não sei se isso seria legal
    • Para referência: https://en.wikipedia.org/wiki/Printer_tracking_dots
    • Como a taxa máxima teórica de produção de desinformação por minuto hoje se compara ao Photoshop de 2021?
  • Ótimo. Dizem que vai ser removido, mas ainda não vi um repositório mostrando isso de forma reproduzível

    • Com 10~15% de força de denoise no Stable Diffusion, já era
      Testei no primeiro dia em que o Nano Banana Pro foi lançado e funcionou. Ainda funciona no Nano Banana 2
      Não publiquei em lugar nenhum porque arrogantemente achei que falar isso em público só deixaria a internet pior. Mas, se eu pensei nisso no primeiro dia, então obviamente milhões de outros programadores também pensaram, então foi pura arrogância
      Só que isso gera artefatos típicos de modelos SD, e eles podem ser detectados por outros meios. Ou talvez dê para ver se ampliar bastante e inspecionar com cuidado
    • Provavelmente é muito mais fácil simplesmente usar outro modelo desde o começo
    • Vai ser removido, mas muita gente não vai fazer isso. Já vi desinformação real detectável por SynthID
  • É primoroso ver este post exatamente ao lado deste outro agora: https://news.ycombinator.com/item?id=48200569

  • É tipo metadado de mp3?
    Se eu tirar um screenshot de uma imagem de IA, ela ainda vai parecer uma imagem de IA? Fico curioso se isso fica escondido dentro da imagem ou se é metadado

    • Fica dentro da imagem, e foi projetado para sobreviver a esse tipo de operação
  • Primeiro vão verificar se a foto veio da OpenAI, e depois vão embutir dados do assinante e geolocalização
    No fim, vão descobrir que ninguém quer ver fotos ou texto gerados por IA. Aí essa ferramenta vai fracassar para o público e passar a funcionar só para governos

    • O único uso de conteúdo gerado por IA com realismo fotográfico parece ser enganar. Vídeos gerados por IA já estão sendo usados em anúncios políticos nos EUA
  • Essas marcas-d'água não são fáceis de remover ou distorcer? Parece útil só até o ponto em que as pessoas dependam disso tão raramente que não valha a pena contornar
    Se plataformas de mídia social começarem a banir imagens com essas marcas-d'água, parece que elas vão desaparecer da noite para o dia

    • Não. Elas são muito robustas contra transformações fáceis de fazer. Isso não quer dizer que sejam impossíveis de remover
    • Ainda não vi nenhum repositório no GitHub que realmente remova a marca-d'água verdadeira do SynthID de saídas reais do Nano Banana 2/NBPro. A maioria ainda é projeto de pesquisa sem resultado prático
      Até agora, os métodos que vi são só truques estranhos usando transparência ou sobreposição da imagem original ao usar recursos de edição, ou então regenerar a imagem produzida pelo NB com modelo de difusão em baixo nível de ruído, caso em que a original também muda
    • Precisamos definir “facilmente”. Existe uma abordagem baseada em análise espectral da imagem e, à primeira vista, parece funcionar
      https://github.com/aloshdenny/reverse-SynthID
    • Isso foi divulgado há alguns anos e aparentemente ainda não foi quebrado. Em algum momento vai ser, mas, se alguém tiver que esperar 1 ou 2 anos entre criar um deepfake e postar no Facebook, isso talvez já seja suficiente. Talvez até um mês de atraso já baste
    • Um método em que a IA recria a imagem do zero a partir de uma descrição muito detalhada parece que funcionaria
  • Isso parece inferior ao padrão aberto real C2PA: https://contentauthenticity.org/