- Depois que um tribunal dos EUA ordenou que a OpenAI preserve indefinidamente todos os logs do ChatGPT (incluindo chats apagados), dois usuários tentaram intervir alegando 'vigilância em massa', mas o pedido foi rejeitado
- Um dos usuários argumentou que, por já ter inserido informações pessoais sensíveis e dados comerciais no serviço, a ordem equivaleria a um programa de vigilância em massa em todo o território dos EUA
- O juiz deixou claro que uma simples ordem de preservação de provas não é um programa de vigilância, e o Judiciário não é um órgão de investigação
- A organização de direitos digitais (EFF) também expressou preocupação com os riscos à privacidade dos usuários e o potencial de abuso no futuro
- Os usuários demonstram ansiedade diante da postura firme da OpenAI e incerteza sobre uma eventual divulgação de dados ou maior transparência no futuro
Contexto e ordem do tribunal
- Recentemente, o tribunal ordenou à OpenAI que preserve indefinidamente todos os logs do ChatGPT, inclusive chats apagados
- A medida foi determinada para garantir provas em um processo de direitos autorais movido por empresas de mídia jornalística
- Alguns usuários manifestaram preocupação porque a ordem inclui até chats apagados e anônimos e está sendo aplicada sem aviso aos usuários
Tentativa de intervenção dos usuários e controvérsia sobre privacidade
- Um usuário pediu para intervir, alegando que havia inserido informações pessoais e comerciais sensíveis e que a ordem levaria a uma vigilância em massa em escala nacional nos EUA
- Ele questionou o fato de chats apagados e anônimos estarem sendo preservados sem aviso prévio e pediu exceções para conversas sobre temas sensíveis, como saúde, finanças e direito
- O tribunal rejeitou o pedido e foi explícito: "uma ordem de preservação de documentos não tem relação com vigilância, e o tribunal não é um órgão de investigação"
Visão da organização de direitos digitais
- Corynne McSherry, diretora jurídica da Electronic Frontier Foundation (EFF), manifestou preocupação ao dizer que "esta ordem traz riscos reais à privacidade dos usuários e pode prejudicar litígios semelhantes"
- Ela apontou que isso pode se tornar um precedente para que autoridades policiais ou partes em processos exijam da OpenAI o fornecimento de registros de usuários
- Destacou especialmente que, se o controle dos usuários sobre seus registros e a obrigação de notificá-los continuarem insuficientes, chatbots de IA podem se tornar um novo vetor de vigilância
Lógica da decisão judicial
- O juiz entendeu que "a ordem de preservação de documentos é uma medida voltada a preservar provas para um litígio específico" e que alegações de violação de direitos constitucionais não têm relação com o mérito deste processo
- Considerou que a tentativa de intervenção não contribuía para esclarecer os fatos nem para as questões centrais do processo, servindo apenas para atrasar a ação, e por isso não reconheceu esse direito
- Como ainda não houve nenhum caso em que dados tenham sido efetivamente entregues às empresas de mídia, sinalizou que pode haver discussão adicional no futuro caso esses dados venham a ser compartilhados
Ansiedade dos usuários e questões futuras
- O usuário demonstrou preocupação de que "a OpenAI possa priorizar outros interesses, como custos do litígio e gestão de reputação, acima da proteção da privacidade"
- A EFF e outros grupos enfatizam que empresas de apps de chat com IA precisam realmente apagar registros quando houver pedido de exclusão e notificar de forma transparente sobre solicitações de dados
- Em última instância, a transparência no processo de retenção e divulgação de dados dos usuários, os procedimentos de notificação e os mecanismos de reparação posterior devem se tornar temas centrais daqui para frente
1 comentários
Comentários no Hacker News
Pela fala da juíza citada na matéria, dá a sensação de que ela não entendeu direito a essência da questão levantada, e ao mesmo tempo a fundamentação da decisão parece estranha
A lógica parece ser: "se considerarmos esse tipo de pergunta, isso só causará atraso indevido para resolver as questões jurídicas que realmente precisam ser tratadas"
Fica a dúvida se, por ser um processo relacionado a direitos autorais, então questões constitucionais poderiam ser ignoradas
Também acho que rejeitar o pedido de imediato só porque não foi redigido por um advogado foge do papel esperado de uma juíza
Parece que ela ignorou o fato de que é possível apresentar uma demanda sem advogado
Lendo a decisão completa anexada à matéria (aqui), a situação fica mais clara
A parte que levantou a questão apresentou um tipo específico de "pedido de intervenção", e isso tem requisitos rigorosos
Esses requisitos não foram cumpridos
A parte sobre a rejeição por ter sido apresentada sem advogado também aparece na decisão
Uma pessoa física pode se representar diretamente, mas uma pessoa jurídica (empresa) precisa obrigatoriamente de advogado
Como o caso foi inicialmente protocolado em nome de uma empresa, parece que a juíza agiu de acordo com a lei
Também sinto algo parecido, e me preocupa ainda mais o fato de haver muitos serviços semelhantes que podem ser atingidos por esse tipo de problema de privacidade
Precisamos de uma lei forte de privacidade que impeça ordens judiciais excessivas desse tipo, mas ela ainda não existe
Por exemplo, poderia haver uma ordem judicial para guardar todas as mensagens trocadas em um serviço de namoro, para uma operadora armazenar todas as mensagens de texto, ou para preservar bilhões de Google Docs gerados
Fico me perguntando por que o governo ainda não exigiu que serviços como o Signal adicionem backdoors e armazenem todas as mensagens de texto
Acho que, para isso acontecer de fato, seria preciso uma justificativa muito forte
Tenho dúvidas se o governo dos EUA já não vem realizando esse tipo de vigilância ampla também em serviços comerciais comuns
Na época das revelações de Edward Snowden, também houve interceptação de comunicações do Google
Juízes em geral têm formação jurídica ou experiência no meio legal
Essa juíza também tem carreira como advogada e ainda tem um histórico incomum de quase ter concluído um doutorado em zoologia
É algo muito natural que grupos protegidos socialmente não queiram tratar grupos não protegidos como iguais
Também não vejo com clareza que exista uma questão constitucional nesse caso e, mesmo que existisse, esse não seria o foro para julgá-la
A crítica de que isso foi ignorado por ter sido apresentado sem advogado é 100% um mal-entendido
Existe toda uma regulamentação para Pro Se (autodefesa judicial)
Se alguém tenta abrir processo representando outra entidade jurídica da qual não é parte, aí sim é obrigatório ter advogado
A ideia não é exatamente "como o tema do processo é direito autoral, questões constitucionais podem ser ignoradas", mas sim que, na visão da juíza, provavelmente não há questão constitucional válida ali e isso só faria perder tempo
Sobre a parte de "por ser um processo de direitos autorais, questões constitucionais podem ser ignoradas?"
Fico curioso sobre qual questão constitucional estaria sendo alegada
A afirmação de que "é possível fazer isso sem advogado" também não procede, porque juridicamente empresas precisam obrigatoriamente de advogado
Se fosse uma pessoa agindo em nome próprio, talvez houvesse alguma tolerância, mas isso não se aplica a empresas
Se o raciocínio já vacila nesse ponto básico, fica difícil confiar nos demais argumentos
Esse caso em si não parece ter tanto valor jornalístico assim
A OpenAI em breve deve fazer sustentação oral tentando barrar diretamente a ordem de preservação de dados, e os dois pedidos preventivos apresentados por usuários comuns do ChatGPT nunca pareceram algo que decidiria o resultado
A juíza parece não entender bem o impacto real que uma ordem de "preservar todos os dados" tem sobre uma empresa, nem demonstrar vontade de reconsiderar isso rapidamente
Há quem diga que justamente o impacto da decisão inicial já é notícia suficiente
Hoje em dia, acredito que até conclusões óbvias têm enorme valor jornalístico
Com isso, confirmamos que o usuário tem direito de participar diretamente
Como os autores fizeram, a própria pessoa também pode mover uma ação por conta própria
O resultado é outra questão, mas esse direito em si existe
Como a juíza parece não ter interesse nesse tema, a conclusão é que tentar convencê-la não adianta
Fico pensando quais alternativas ou opções restam para a OpenAI e para os usuários
Não é uma resposta direta, mas acho que usar LLM local é a alternativa mais realista daqui para frente
Tenho testado isso ultimamente e, embora ainda haja limitações em retenção de contexto e desempenho, não me parece fantasia imaginar LLMs locais suficientemente práticos daqui a 1 ou 2 anos
Para mim, mais do que privacidade, o uso offline é o que mais atrai
Pelo direito dos EUA, não há opção
Isso se encaixa perfeitamente na chamada doutrina do terceiro
Mesmo que sejam seus dados, se você os fornece voluntariamente a um terceiro (OpenAI), esses dados deixam de ser "seus" e a expectativa de privacidade deixa de existir
Exceções só podem ser reconhecidas por leis novas criadas especificamente para isso, e hoje isso não se aplica à OpenAI
A decisão também foi dada dentro desse arcabouço jurídico dos EUA, então, pelo padrão atual, não há proteção de privacidade para os dados de conversa enviados à OpenAI
É melhor parar de esperar privacidade de terceiros
Até dados bancários podem ser revelados mediante ordem judicial
Há muitos programadores que não entendem essa realidade e confundem isso com os temas quentes do momento
Independentemente de como a decisão sair daqui para frente, recorrer pode ser uma alternativa
Para a pergunta "quais são as opções da OpenAI e dos usuários?"
Uma possibilidade é buscar serviços de países que não entreguem dados aos EUA
Se alguém realmente acha que a OpenAI não vai armazenar tudo que é enviado aos chats ou à API, eu recomendaria dar uma boa olhada em quem compõe o conselho da OpenAI
Mesmo que fornecedores de LLM como a OpenAI fossem legalmente proibidos de armazenar dados, ainda seria difícil confiar que eles cumpririam isso de forma adequada na prática
A sugestão é que dados sensíveis sejam sempre inseridos diretamente em um LLM local
Espero que percebam a dupla negação
O mundo inteiro agora tem capacidade técnica de vigiar todos os aspectos da vida cotidiana, então a questão é como vamos lidar com isso
No futuro, acho que essa massa de dados pode dar origem a novas áreas como medicina, epidemiologia e psicologia em larga escala (eu chamaria de Massive open online psychology, moop), e talvez governos possam usar big data em tempo real para atender melhor cidadãos negligenciados
Mas, para esse futuro existir, é indispensável haver uma estrutura legal confiável, e não acredito que isso possa ser construído de forma fragmentada, decisão por decisão
Pessoalmente, acho que qualquer dado que só possa existir porque um ser humano agiu diretamente deveria pertencer automaticamente a essa pessoa, e o armazenamento por terceiros só deveria ser permitido quando fosse para benefício daquele ser humano
Se um padrão elevado como "em benefício do usuário/cidadão" fosse adotado, a mentalidade das empresas de dados mudaria completamente
Gostaria de saber o que os outros pensam sobre isso
Ainda é uma direção meio tabu em lugares como o HN, mas acho que só se os dados ficarem travados em torno do usuário e distribuídos em vez de presos em silos centralizados será possível buscar ao mesmo tempo privacidade e as vantagens do big data
A juíza deste caso, na verdade, é uma magistrate judge com pouco mais de um ano restante de mandato
Já houve antes caso de magistrado que tomou uma decisão fraca como essa e não teve o mandato renovado; espero que aconteça o mesmo desta vez
Link do aviso de renovação do mandato
Não entendo por que colocar aspas no título de juíza
Magistrate judge continua sendo juíza
Referência: tipos de juízes nos tribunais federais dos EUA
Não acho que uma aplicação comum da doutrina do terceiro devesse prejudicar o mandato ou a reputação de uma magistrate judge
Referência a uma discussão anterior sobre o mesmo tema OpenAI reage à ordem judicial para preservar todos os logs do ChatGPT, inclusive conversas apagadas
Nenhum juiz pode barrar um programa de vigilância em massa que já dura mais de 10 anos
A esta altura isso já virou piada e controvérsia vazia
A OpenAI, como qualquer outra empresa, coleta toda a informação possível e faz perfilamento sobre nós
Acho estranho que tanta gente esteja chocada ou revoltada com essa situação
Parece que a maioria simplesmente não sabe, ou ignora, que os serviços online usados no dia a dia fazem exatamente a mesma coisa com os dados
Na prática, a menos que seja algo como o Signal com E2EE, serviços grandes como Gmail, operadoras, Reddit e Xitter preservam dados e metadados
Independentemente de isso ser certo ou errado, essa é a realidade normal dos serviços online hoje
O motivo da revolta é que essa realidade passa a parecer de um nível inaceitável
Separadamente de termos de uso ou políticas, a OpenAI está sendo obrigada a preservar até dados que tentaria apagar em benefício do usuário
Na verdade, não me surpreende que as pessoas estejam se posicionando ativamente
Acho que a maioria das pessoas simplesmente não sabe disso
Se você perguntar a amigos não técnicos ou a qualquer pessoa na rua, muita gente de fato não tem consciência dessa realidade