OpenAI adota a marca d'água SynthID do Google em imagens de IA junto com ferramenta de verificação
(openai.com)- A OpenAI está reforçando um modelo de procedência em camadas que combina conformidade com a C2PA, marca d'água SynthID e uma ferramenta pública de verificação para identificar conteúdo gerado por IA
- A C2PA transporta junto o contexto de criação e edição do conteúdo com metadados e assinaturas criptográficas, mas isso pode ser danificado durante processos de transformação
- O SynthID do Google DeepMind adiciona uma marca d'água invisível a imagens geradas por ChatGPT, Codex e OpenAI API para compensar as limitações dos metadados
- A prévia da ferramenta pública de verificação ajuda a determinar se uma imagem foi gerada pela OpenAI ao verificar Content Credentials e SynthID em imagens enviadas
- Uma única tecnologia não é suficiente; o ecossistema de procedência fica mais forte ao combinar padrões comuns, marca d'água persistente e verificação pública
Fortalecendo a abordagem de procedência de conteúdo
- A OpenAI está reforçando um modelo de procedência em camadas para construir confiança online e pretende aumentar a identificabilidade de conteúdo gerado por IA com base em padrões abertos e colaboração entre plataformas
- Há três mudanças principais
- Conformidade com a C2PA para ajudar outras ferramentas e plataformas a reconhecerem sinais de procedência com mais facilidade
- Em colaboração com o Google, a adição de marca d'água SynthID às imagens
- Uma prévia de ferramenta pública de verificação para que o público possa conferir se uma imagem foi gerada pela OpenAI
- Sinais de procedência fornecem o contexto necessário para avaliar de onde o conteúdo veio, como foi gerado ou editado e se corresponde ao que afirma ser
Ecossistema de confiança com conformidade à C2PA
- A OpenAI participa do desenvolvimento e da adoção de padrões de procedência desde 2024, e começou a adicionar Content Credentials a imagens geradas pelo DALL·E 3
- Depois disso, Content Credentials também passaram a ser aplicadas ao ImageGen e ao Sora
- A OpenAI entrou para o comitê diretor da Coalition for Content Provenance and Authenticity (C2PA), um grupo multissetorial que promove padrões tecnológicos abertos para procedência de conteúdo
- A C2PA funciona usando metadados e assinaturas criptográficas para ajudar informações sobre a mídia a serem transportadas com segurança junto com o próprio conteúdo
- Essas informações fornecem contexto para jornalistas que avaliam procedência, plataformas que tomam decisões relacionadas à integridade e pessoas que querem entender o conteúdo online
- A OpenAI recentemente se tornou um produto gerador em conformidade com a C2PA
- A conformidade com a C2PA serve de base para que plataformas possam ler, preservar e transmitir de forma confiável as informações de procedência anexadas ao conteúdo
- As informações de procedência ganham mais valor quando são mantidas além da plataforma em que o conteúdo foi originalmente gerado, e a conformidade torna isso possível
Procedência de imagem em camadas com SynthID
- Os metadados da C2PA são a base para transportar informações sobre de onde o conteúdo veio, como foi gerado ou editado e quem assinou essas informações
- Metadados podem ser removidos, desaparecer em processos de upload e download ou ser danificados por transformações como mudança de formato de arquivo, redimensionamento e capturas de tela
- Para tornar as informações de procedência mais robustas, a OpenAI está adotando uma marca d'água invisível por meio do SynthID do Google DeepMind
- A aplicação começa primeiro com imagens geradas por ChatGPT, Codex e OpenAI API
- O SynthID funciona como uma camada adicional de marca d'água que complementa a abordagem baseada em metadados da C2PA
- A OpenAI já vinha testando abordagens de procedência e marca d'água em ambientes reais de implantação
- O Sora usa marca d'água visível
- O Voice Engine usa marca d'água em áudio
- A empresa continua testando e pesquisando se a precisão e a confiabilidade se mantêm ao longo do tempo
- C2PA e SynthID compensam fraquezas diferentes um do outro
- A C2PA ajuda a incluir contexto detalhado no conteúdo, mas os metadados podem ser removidos ou danificados
- O SynthID ajuda a preservar o sinal mesmo quando os metadados não são mantidos, e pode resistir por mais tempo a transformações como capturas de tela
- Metadados fornecem mais informações do que uma marca d'água sozinha conseguiria oferecer
- Usar as duas abordagens em conjunto torna a resiliência das informações de procedência do conteúdo maior do que ao usar cada uma isoladamente
Prévia da ferramenta pública de verificação
- A OpenAI está oferecendo em versão prévia uma ferramenta pública de verificação para ajudar a confirmar se uma imagem foi gerada pelo ChatGPT, pela OpenAI API ou pelo Codex
- Essa ferramenta verifica se há sinais de procedência como Content Credentials e SynthID na imagem enviada
- O objetivo é integrar vários sinais para ajudar usuários a verificar e interpretar com mais facilidade as informações de procedência do conteúdo
- A ferramenta pública de verificação consegue detectar com confiabilidade marcas d'água SynthID originadas na OpenAI e, quando encontra metadados da C2PA, pode mostrá-los junto
- Como nenhum método de detecção é perfeito, ela não tira conclusões definitivas quando a detecção falha
- Mesmo que metadados ou marca d'água não sejam detectados, isso não significa necessariamente que a imagem não foi gerada com ferramentas da OpenAI
- Sinais de procedência podem ser removidos em alguns casos
- No lançamento, a ferramenta de verificação fica limitada a conteúdo gerado pela OpenAI
- O objetivo é apoiar, nos próximos meses, esforços multissetoriais que permitam verificação em plataformas de forma mais ampla
- Com o tempo, espera-se que ela também ofereça suporte a mais tipos de conteúdo encontrados online
Próximos desafios
- Uma única tecnologia de procedência não é suficiente
- Uma abordagem forte de procedência precisa combinar padrões comuns, sinais de marca d'água duradouros e verificação pública
- Com o suporte existente a Content Credentials, a conformidade com a C2PA, a adoção do SynthID e a prévia da ferramenta pública de verificação, a OpenAI quer contribuir para um ecossistema de procedência mais interoperável
1 comentários
Comentários do Hacker News
Se você fizer uma imagem de IA com fundo preto, o SynthID fica visível em um monitor decente. É só um padrão borrado repetitivo, nada de especial
Consegui remover bem mascarando cada segundo pixel, regenerando os pixels faltantes e depois repetindo o processo com um deslocamento de 1 pixel, novamente mascarando cada segundo pixel
Usei um modelo pronto para preencher os pixels, mas antes da alteração primeiro exportei o mapa de profundidade e reduzi o ruído para que os novos pixels mascarados combinassem com o conteúdo original. O resultado não ficou 100% perfeito, mas, com mais tempo e um modelo ajustado para esse uso, parece que daria para remover qualquer tipo de marca-d'água de IA sem grande dificuldade
https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
Que tipo de informação entra nos metadados ou no SynthID? Quantos bits o SynthID consegue codificar?
Será que daria para fazer uma espécie de tabela nutricional para conteúdo sintético? Algo como 10% de texto sintético, 30% de imagem sintética
Hoje a sua realidade foi 15% sintética (75% big tech, 25% neocloud de pesos abertos)
A versão realmente implantada provavelmente deve ser bem diferente
[0]:https://arxiv.org/html/2510.09263v1
O SynthID parece estar completamente comprometido, mas a nova marca-d'água da OpenAI aparentemente ainda não, o que é interessante [1]
[1] https://github.com/wiltodelta/remove-ai-watermarks
Isso é só teatro inútil
Para quem cria coisas com ferramentas em várias mídias, eu simplesmente evitaria ferramentas assim, que inserem metadados arbitrários que eu não escolhi
Estou criando texturas para videogame e tenho que colocar esse estranho resíduo de DRM? O Photoshop existe há tanto tempo, por que seria exceção?
O Photoshop não foi feito pelo Google nem pela OpenAI, e a barreira de entrada para criar imagens realistas e enganosas com Photoshop é muito maior do que com IA. Já existem técnicas, ainda que imperfeitas, para detectar uso de edição de imagem tradicional
O SynthID só seria DRM se o Google ou a OpenAI estivessem reivindicando propriedade intelectual sobre suas próprias imagens, e eu não sei se isso seria legal
Ótimo. Dizem que vai ser removido, mas ainda não vi um repositório mostrando isso de forma reproduzível
Testei no primeiro dia em que o Nano Banana Pro foi lançado e funcionou. Ainda funciona no Nano Banana 2
Não publiquei em lugar nenhum porque arrogantemente achei que falar isso em público só deixaria a internet pior. Mas, se eu pensei nisso no primeiro dia, então obviamente milhões de outros programadores também pensaram, então foi pura arrogância
Só que isso gera artefatos típicos de modelos SD, e eles podem ser detectados por outros meios. Ou talvez dê para ver se ampliar bastante e inspecionar com cuidado
É primoroso ver este post exatamente ao lado deste outro agora: https://news.ycombinator.com/item?id=48200569
É tipo metadado de mp3?
Se eu tirar um screenshot de uma imagem de IA, ela ainda vai parecer uma imagem de IA? Fico curioso se isso fica escondido dentro da imagem ou se é metadado
Primeiro vão verificar se a foto veio da OpenAI, e depois vão embutir dados do assinante e geolocalização
No fim, vão descobrir que ninguém quer ver fotos ou texto gerados por IA. Aí essa ferramenta vai fracassar para o público e passar a funcionar só para governos
Essas marcas-d'água não são fáceis de remover ou distorcer? Parece útil só até o ponto em que as pessoas dependam disso tão raramente que não valha a pena contornar
Se plataformas de mídia social começarem a banir imagens com essas marcas-d'água, parece que elas vão desaparecer da noite para o dia
Até agora, os métodos que vi são só truques estranhos usando transparência ou sobreposição da imagem original ao usar recursos de edição, ou então regenerar a imagem produzida pelo NB com modelo de difusão em baixo nível de ruído, caso em que a original também muda
https://github.com/aloshdenny/reverse-SynthID
Isso parece inferior ao padrão aberto real C2PA: https://contentauthenticity.org/