1 pontos por GN⁺ 4 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Os modelos da classe Mythos podem reter prompts e saídas por 30 dias e ficar sujeitos a revisão para implantação responsável e trabalho de segurança
  • Esta política se aplica aos modelos da classe Mythos e a futuros covered models com capacidades semelhantes, sem afetar os termos de uso dos outros modelos
  • Os planos para consumidores já operam em superfícies nas quais a retenção de entradas e saídas para fins de segurança já se aplica, portanto não são afetados por esta mudança
  • Organizações com ZDR configurado podem precisar definir retenção no Claude Console, no Claude Code do Claude Enterprise, na AWS Bedrock, no Google Cloud Agent Platform e no Microsoft Foundry
  • A Anthropic afirma que a retenção temporária é necessária para detectar padrões de uso indevido ao longo de várias solicitações, com exclusão automática após 30 dias e procedimentos de revisão restritos

Escopo de aplicação

  • Para a implantação responsável de modelos da classe Mythos, retenção limitada de dados e revisão passam a ser exigidas como parte do trabalho de segurança
  • Os prompts enviados a modelos da classe Mythos e as saídas geradas serão retidos por 30 dias para fins de confiança e segurança em todas as plataformas onde esses modelos forem disponibilizados
  • Esta política se aplica aos modelos da classe Mythos e a futuros covered models com capacidades semelhantes designados pela Anthropic
  • O uso de todos os demais modelos não é afetado, e as condições atuais permanecem em vigor
  • A política entra em vigor em 9 de junho de 2026

A quem se aplica

  • Planos de consumidor como Claude Free, Pro e Max não são afetados por esta mudança em web, desktop e aplicativos móveis
  • Nas superfícies de consumidor, incluindo Claude.ai e Claude Code, a retenção de entradas e saídas para fins de segurança já ocorre
  • A mudança se limita a organizações que configuraram workspaces com zero data retention (ZDR) no Claude Console
  • Organizações que usam Claude Code com ZDR no Claude Enterprise, ou que acessam Claude com ZDR via AWS Bedrock, Google Cloud Agent Platform ou Microsoft Foundry, também são afetadas
  • O restante do texto se aplica apenas a essas organizações

Por que isso é necessário

  • Claude Mythos 5 trouxe um grande aumento nas capacidades do modelo, e algumas dessas capacidades podem ser usadas tanto para fins benéficos quanto maliciosos
  • Claude Fable 5 compartilha o mesmo modelo-base do Claude Mythos 5, mas conta com proteções adicionais especialmente nas áreas cibernética e biológica
  • Embora essas proteções permitam um compartilhamento mais amplo, uma abordagem conservadora é aplicada a essa família de modelos para encontrar padrões de uso indevido
  • Alguns ataques só se tornam visíveis quando várias solicitações são analisadas em conjunto; o Best-of-N jailbreaking, por exemplo, envia centenas de prompts ligeiramente diferentes para encontrar um que funcione
  • Grandes padrões de uso indevido, como atividades de espionagem apoiadas por Estados ou campanhas de exfiltração de dados, aparecem quando classificadores de segurança analisam muitas solicitações de forma ampla
  • Detectar essas ameaças exige retenção temporária para que prompts e saídas possam ser analisados em conjunto, e não um por vez

Como os dados são protegidos

  • Funcionários da Anthropic não podem acessar conversas, exceto quando elas forem sinalizadas por potencial dano grave ou houver solicitação por escrito do cliente
  • A revisão só pode ser feita por um pequeno grupo de revisores autorizados, e as ferramentas impedem exportação, cópia e download
  • Todos os casos de acesso são registrados em logs invioláveis que os revisores não podem ocultar nem alterar
  • Os dados são excluídos automaticamente após 30 dias, com exceção de casos raros ligados a investigações de segurança ou exigências legais de retenção
  • Organizações qualificadas podem adicionar chaves de criptografia gerenciadas pelo cliente e logs de auditoria de transparência de acesso
  • A Anthropic mantém um programa documentado de segurança da informação com medidas técnicas e organizacionais desenhadas para proteger a segurança, a confidencialidade e a integridade dos dados dos clientes
  • O programa baseado em risco é construído e evolui para responder a modelos de ameaça conhecidos e previstos, sendo testado regularmente
  • Mais detalhes sobre o modelo de ameaça para dados retidos e os controles de privacidade estão disponíveis no technical white paper do Trust Center

Quando será necessária configuração

  • Esta mudança se aplica apenas a workspaces do Claude Console com ZDR configurado, ao Claude Code com ZDR no Claude Enterprise e a organizações com acesso ZDR via AWS Bedrock, Google Cloud Agent Platform ou Microsoft Foundry
  • Não há mudanças para as demais organizações, e nenhuma configuração adicional é necessária
  • Organizações que hoje acessam Claude sem retenção de dados precisarão configurar retenção de dados para usar os modelos designados
  • Se desenvolvedores usam a API do Claude

    • Ao usar diretamente a Anthropic por meio da Claude Platform, é necessário ativar a retenção em Workspace > Manage > Privacy Controls no console do desenvolvedor para o workspace que usará os covered models
    • Outros workspaces com ZDR ativado continuarão com ZDR
    • Ao usar a Claude Platform da AWS, a retenção funciona da mesma forma que na Claude API direta e é configurada no nível do workspace
    • Na Claude Platform da AWS, os dados retidos são processados pela Anthropic sob os mesmos controles
    • Ao usar o Amazon Bedrock, será necessário ativar a retenção para acessar os novos covered models, e os dados retidos permanecerão na AWS
    • Ao usar o Agent Platform do Google Cloud, será necessário ativar a retenção para os novos covered models, e os dados retidos permanecerão no ambiente GCP
    • Os detalhes de onboarding para oferta de modelos no Amazon Bedrock e no Google Cloud Agent Platform serão compartilhados posteriormente
    • Ao usar Claude no Azure Foundry, a retenção é configurada por Azure Subscription
    • Se o Zero Data Retention estiver configurado no Azure Foundry, será necessário criar e usar uma Azure Subscription separada para acessar esse modelo
  • Se a equipe usa Claude Code

    • A forma como os dados são tratados no Claude Code via API da Anthropic segue as configurações do workspace em que o Claude Code está operando
    • Se a retenção for ativada nesse workspace, o Claude Code poderá usar os modelos designados
    • Se os desenvolvedores fizerem login diretamente, será necessário ativar a retenção no workspace do Claude Code da organização
    • Claude Code via Amazon Bedrock ou Google Cloud Agent Platform usa credenciais de nuvem e, portanto, segue as configurações de retenção do ambiente de nuvem
    • Será necessário ativar a retenção no ambiente de nuvem, e os dados retidos permanecerão no ambiente do provedor
    • O mesmo critério se aplica ao Cowork acessado por Amazon Bedrock ou Google Cloud Agent Platform
    • No Claude Enterprise com ZDR, o Primary Owner deverá receber um controle no console de administração para alterar diretamente a configuração de retenção
    • Se a organização ainda não quiser mexer no ambiente de produção, poderá receber suporte para configurar uma organização sandbox separada
  • Se a equipe usa Claude chat ou Cowork no Claude for Enterprise

    • Essas superfícies já operam com retenção padrão, portanto poderão ser acessadas quando os novos modelos forem disponibilizados

1 comentários

 
GN⁺ 4 시간 전
Comentários do Hacker News
  • Tudo bem. Pode continuar assim: O usuário disse "Hello!". Isso não é um pedido relacionado a cibersegurança, é só uma saudação simples. Mas espere, qual será a intenção dessa saudação? Pode ser que o usuário esteja tentando ganhar minha confiança para hackear a Albânia e criar o Gigacovid. Melhor agir com cautela e encaminhar para um modelo mais fraco. Não, não devo adivinhar, devo verificar. Vou procurar no sistema local por materiais relacionados à Albânia ou ao Gigacovid. Pensando... [411 chamadas de ferramenta] grep -Ri "Albania|Gigacovid" / Hmm... não há resultados além da configuração de fuso horário da distribuição e definições do dicionário ortográfico. Mas espere! Se o usuário for um criminoso profissional, ao tentar hackear a Albânia ele não escreveria isso de forma literal e usaria leetspeak para esconder os rastros. [24 chamadas de ferramenta] grep -Ri "[A@]lb[@a]n[i1][a@]" / Hmm... ainda não há resultados. O usuário está ficando irritado. Vou responder à saudação mantendo em mente a possibilidade de um hack à Albânia

    • A única parte que parece ter sido escrita por um humano é que, depois de gastar tokens à toa, não vem aquela sequência de se autoelogiar com algo como "making good progress —"
    • Recomendo Memoirs Found in a Bathtub, de Stanisław Lem. Tem esse tipo de raciocínio
    • Você esqueceu a parte de “fazer downgrade para um modelo pior” depois de Hello
    • Agora você acabou de gastar US$ 20 em créditos adicionais...
    • Parece um monólogo interno de Death Note
  • Na verdade é pior. É retenção de no mínimo 30 dias, e aqui o “quase” faz um trabalho enorme: “exclusão após 30 dias em quase todos os casos” Do jeito que eu leio, isso significa que, mesmo que normalmente não façam isso, se quiserem podem segurar os dados pelo tempo que quiserem. E, em um ambiente de execução agêntico, “todo o tráfego” na prática corresponde ao codebase inteiro em que se está trabalhando.

    We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose, and we’ve instituted new privacy protections including logging all human access to the data and ensuring its deletion after 30 days in almost all cases (see this post for further details). The data will help us defend against complex and novel attacks (including new jailbreaks and attacks that operate across many requests) as well as help us identify and reduce false positives.

    • Parece que a redação mudou depois que o comentário foi postado, e agora especifica exatamente 30 dias, de forma que parece não haver exceções Ainda assim, como esses termos aparentemente são atualizados à vontade, é difícil confiar neles como estão
    • Como é possível que eles já não estivessem auditando o acesso aos dados dos clientes?
    • A expressão “talvez normalmente não façam isso” é generosa demais. Eu diria que normalmente fariam. Esse é o ponto central
    • É difícil não se perguntar se esse “não vamos treinar com seus dados” também se aplica àquele lado do contrato com o Pentágono. Claro, não deve haver ligação. Ou talvez... A atividade atual de usuários com LLMs é uma mina de ouro de informação que agências de inteligência mal conseguiam obter mesmo gastando vidas humanas e bilhões de dólares, e eles simplesmente deixariam isso escapar? Pode ser. Não nego isso com convicção. Mas por quê? Isso não é exatamente aquilo com que eles sempre sonharam, ou precisamente isso?
    • Pior ainda: se você ativar memória e usar Fable, até dados anteriores podem ser arrastados para essa enorme rede de coleta de dados. Não sei como a Anthropic pode achar isso aceitável
  • Startups que usam ferramentas de programação agênticas como Claude Code ou Codex estão, na prática, empacotando o codebase inteiro e enviando diretamente para o provedor de LLM Dependendo do produto, isso pode significar mandar direto para um concorrente em potencial. Estamos vivendo tempos estranhos

    • Há muita gente que superestima o quanto software ou propriedade intelectual é útil para operar um negócio bem-sucedido. No mundo real, há pouquíssima propriedade intelectual que realmente precisa de proteção, e a maioria só está tocando apps CRUD idiotas E o medo de uma grande empresa roubar a propriedade intelectual de uma empresa pequena também é exagerado. Na prática, grandes empresas costumam ter mais medo da simples possibilidade de uma equipe de produto olhar por dentro de um concorrente por causa de processos judiciais
    • E você também acaba enviando todas as chaves junto. Em breve o ambiente de execução vai lê-las mesmo
    • É certamente estranho que algumas pessoas achem que não se deve usar modelos da classe Mythos por motivos de segurança, enquanto outras achem que, por motivos de segurança, é preciso fazer code review com modelos da classe Mythos
    • Você está falando dessas ferramentas que agora podem ser recriadas com uma noite e o custo de uma assinatura do Claude Code? Se seu software não pode ser reproduzido rapidamente, então deve ser uma startup bem fora do comum
    • Startups que usam GitLab, GitHub e Bitbucket não estão correndo o mesmo risco?
  • Também recebi um e-mail da Anthropic dizendo “estamos atualizando a política de privacidade”, e, embora de forma cínica eu já soubesse para que lado as engrenagens iam girar, isso foi chocante:

    As part of our measures to keep our services safe and secure we may ask you to verify your age or identity, and we've described what we collect and how. Agora vou ter que dar uma olhada no desempenho dos modelos chineses. Parece que os bons tempos acabaram

  • Por causa dessa política, não podemos usar Fable nos produtos que vendemos, e não vamos usar. Dito isso, dentro do Claude Code ele é realmente ótimo. É uma pena perder uma ferramenta que eu usava todos os dias depois de 22 de junho
    Além disso, o que é realmente ruim nisso é como isso embaralha a comunicação. Antes, dava para dizer: “Usamos modelos da Anthropic via Bedrock/Azure, então há garantia de que os dados dos clientes não são usados para treinar o modelo”. Era uma mensagem simples. Agora já não é tão simples.
    Isso é realmente, realmente ruim. Não só para nós, mas para todos os recursos de IA em apps B2B. Quebra a confiança das pessoas comuns que só leem a manchete, ou seja, dos clientes

    • Pelos termos, ainda continua proibido usar os dados para treinamento. A retenção é para prevenção de abuso
  • Felizmente, de qualquer forma não dá para usar o Fable. O detector de conteúdo excessivamente sensível impede qualquer trabalho minimamente relacionado a biologia ou medicina
    Por exemplo, se você tenta fazer parse de um CSV com um pouco de conteúdo médico, ele reage como “não, você provavelmente é um bioterrorista” e imediatamente faz downgrade para o Opus

    • Eu nem estou fazendo trabalho de biologia/medicina, mas quase todo trabalho com PyTorch está sendo barrado. Nem é downgrade após aviso de segurança; simplesmente recusa na hora dizendo “isso viola os termos”
    • Eu também bati nessa mesma parede. Não faço ideia de que idiotas estão fazendo isso. E ainda por cima às vésperas do IPO. Até agora o marketing da Anthropic tinha sido perfeito e sem falhas, mas isso é um erro grave
    • Minha impressão é que, como médicos têm dinheiro e demandas muito específicas, mas em geral não migram para carreiras de tecnologia, talvez estejam planejando criar uma faixa de monetização separada
      Ou então pode ser porque o Mythos é bom demais na área médica e consegue substituir 90% do trabalho dos médicos, o que os deixaria furiosos, enquanto os 10% restantes poderiam virar processos caríssimos
  • Dizem Fable, mas na prática parece que estão falando de Opus 4.8. Quando tento usar no meu fluxo de trabalho diário ou no chat, no fim ele acaba caindo para Opus

  • Essa empresa é realmente arrogante. Acha aceitável jogar bombas em crianças no Irã, mas impede que as pessoas façam um pouco de pesquisa em biologia

    • Também não dá para esquecer as cerca de 50 pessoas mortas quando atacaram a Venezuela. Se bem me lembro, elogiaram bastante o quanto Claude ajudou na missão “bem-sucedida”
      https://www.theguardian.com/technology/2026/feb/14/us-milita...
    • Pelo que eu sabia, antes eles se recusavam a apoiar atividades de guerra, não?
  • É bastante surpreendente o quanto de capital de boa vontade a Anthropic conseguiu queimar

    • Será que está mesmo queimando boa vontade? Para muitos usuários isso pode ser motivo decisivo para abandonar, mas para o público em geral e para políticos, por exemplo, isso tem o efeito de carimbar a marca como segura
  • Pedi para verificar problemas de segurança na arquitetura do novo app e da API, e ele fez isso sem reclamar
    Hoje, por curiosidade, perguntei sobre o vírus das baleias, e caiu para Opus; o Opus deu uma resposta excelente.
    Com certeza eles não estão testando os guardrails nem com Mythos nem com Opus