Conversas do CEO da Amazon com autoridades dos EUA desencadeiam repressão a modelos da Anthropic
(wsj.com)- O governo Trump decidiu bloquear todo o uso internacional dos modelos de IA mais avançados da Anthropic, após conversas entre o CEO da Amazon e autoridades dos EUA, incluindo o secretário do Tesouro
- Pesquisadores da Amazon conseguiram obter, com uma série de prompts, informações bloqueadas no modelo Fable 5 que poderiam ser usadas em ciberataques, e isso foi repassado às autoridades
- Após uma reunião de resposta, a Casa Branca decidiu que a solução mais direta seria bloquear o acesso aos modelos por governos, empresas e indivíduos estrangeiros, com aprovação do presidente Trump por motivos de segurança
- Para cumprir as regras, a Anthropic bloqueou todo o acesso de usuários ao Mythos e ao Fable, deixando muitos pesquisadores estrangeiros da empresa na prática excluídos do trabalho nos modelos mais recentes
- Além das preocupações de segurança, há suspeitas de que a desconfiança e a tensão política do governo em relação à Anthropic também tenham influenciado a decisão, vista como parte de um movimento mais amplo de fortalecimento do controle estatal sobre a indústria de IA
Como a repressão começou
- Conversas de Andy Jassy, CEO da Amazon, com autoridades dos EUA, incluindo o secretário do Tesouro Scott Bessent, desencadearam a decisão de bloquear o uso no exterior
- Jassy informou às autoridades que pesquisadores da Amazon haviam obtido no Fable 5 informações úteis para apoiar ciberataques que deveriam estar bloqueadas
- Executivos do setor de tecnologia mantêm contato regular com o governo sobre o poder das ferramentas avançadas de IA
- Logo depois, autoridades da Casa Branca realizaram uma reunião para discutir a resposta, e pesquisadores de segurança começaram a verificar a alegação da Amazon
- Foi decidido que bloquear o acesso à ferramenta por governos, empresas e indivíduos estrangeiros seria a forma mais direta de eliminar o risco
- O presidente Trump aprovou a medida por motivos de segurança, apesar de preocupações com possível prejuízo à inovação
Resposta da Anthropic e impacto
- Para cumprir as regras, a Anthropic bloqueou todo o acesso de usuários ao Mythos e ao Fable
- Isso pode prejudicar os esforços de empresas no mundo todo para usar essas ferramentas na identificação de vulnerabilidades de software
- Como muitos pesquisadores da Anthropic são estrangeiros, a regra torna na prática impossível seu trabalho com os modelos mais recentes
- A Anthropic afirmou que a vulnerabilidade apontada pela Amazon é relativamente básica, que também pode ser encontrada em outros modelos públicos e que não configura um jailbreak completo
- Alguns pesquisadores de segurança concordam com essa avaliação
- A empresa disse ter salvaguardas adequadas e priorizar a segurança, e que já havia suspendido anteriormente a ampliação do acesso ao Mythos por orientação da Casa Branca
Relação entre Amazon e Anthropic
- A Amazon é uma grande investidora da Anthropic, fornece chips para data centers e usa os modelos mais avançados para identificar vulnerabilidades de software
- Um porta-voz da Amazon afirmou que, como grande provedora de nuvem, não é incomum que o governo peça consultoria sobre riscos de segurança, mas que a empresa não compartilha detalhes dessas conversas
- Segundo um relatório sobre o Fable compartilhado pela Amazon com especialistas em cibersegurança, um conjunto específico de consultas encontrou bugs de segurança em pelo menos 4 programas de software
- Trata-se de uma informação que o Fable normalmente não fornece, mas Andrew Morris, fundador da GreyNoise Intelligence, avaliou que isso está longe de ser informação perigosa de cibersegurança
- Muitas outras ferramentas já conseguem revelar essa informação, mas o software da Anthropic é conhecido pela capacidade de converter dados sobre bugs em código de exploit funcional
- Essa capacidade é protegida pelos guardrails de segurança do Fable, e não há evidência de que os pesquisadores da Amazon tenham acessado isso
Movimento de reforço do controle do governo
- Uma ordem executiva recente que dá às autoridades de segurança poder de supervisão sobre modelos, somada às discussões sobre compra de participação estatal em empresas de IA, indica um rápido aumento do controle que o governo quer exercer sobre a indústria
- Adam Thierer, do R Street Institute, afirmou que a politização da IA nos EUA e a centralização do controle sobre computação avançada estão se aprofundando significativamente
- A ligação de Jassy foi vista por alguns como um alerta comum, mas rapidamente se ampliou para um amplo bloqueio de usuários estrangeiros pelo Commerce Department
- O National Cyber Director Sean Cairncross e o secretário de Comércio Howard Lutnick participaram das conversas
- O Commerce Department é responsável pelos controles de exportação de tecnologias centrais
Tensão entre Anthropic e o governo
- A medida reacendeu um conflito antigo entre a Anthropic e o governo Trump, que mantém desconfiança em relação aos vínculos da empresa com doadores progressistas e seus alertas sobre riscos da IA
- A Anthropic contratou vários ex-integrantes do governo Biden, e Amodei vem criticando Trump e seu governo
- Em um conflito sobre o uso de ferramentas de IA pelos militares, o Pentágono adotou a medida sem precedentes de classificar a Anthropic como risco de segurança, e a empresa responde com dois processos judiciais
- Kate Koren, do CSIS, disse entender as preocupações de segurança, mas afirmou que a antipatia da Casa Branca em relação à Anthropic pode ter influenciado a decisão
- Uma autoridade sênior da Casa Branca disse que a medida diz respeito à segurança dos modelos e que o Departamento de Defesa não esteve profundamente envolvido
Impacto nos negócios e contexto
- O bloqueio dos modelos mais avançados pode prejudicar a Anthropic, que pode preparar uma oferta pública inicial (IPO) já neste outono, e beneficiar concorrentes como a OpenAI caso usuários migrem para outros modelos
- A OpenAI vem oferecendo gradualmente aos clientes seu próprio modelo forte para cibersegurança e está em conversas com o governo Trump
- A Anthropic foi fundada em 2021 por Amodei e ex-integrantes da OpenAI que consideravam que a empresa não dava ênfase suficiente à segurança em IA, e cresceu como importante fornecedora corporativa com a força da ferramenta Claude Code
- Desde o início deste ano, a Anthropic vinha oferecendo antecipadamente o Mythos à Amazon e a outras empresas de tecnologia, em uma abordagem gradual negociada com o governo
- O objetivo era permitir que usuários centrais encontrassem e corrigissem vulnerabilidades de software antes do lançamento público
- Uma reunião de abril com presença de Amodei, Bessent e a chefe de gabinete da Casa Branca, Susie Wiles, foi vista como uma chance de reconciliação, mas também incluiu discussões de segurança
1 comentários
Comentários no Hacker News
Já se sabe que todo LLM pode sofrer jailbreak, então é difícil entender por que foram avisar o governo
A menos que isso signifique que o GPT 5.5 atingiu o limite do que é permitido para LLMs americanos com acesso público, é difícil ver isso como uma tentativa razoável de regulação
Fico curioso sobre qual é exatamente a linha que, na visão do governo, o Fable 5 cruzou. Não sei se é número de parâmetros, resultado em benchmark específico ou computação de treinamento
Se o motivo é simplesmente que ele pode ajudar em ciberataques e é passível de jailbreak, então todos os modelos já lançados antes carregam a mesma responsabilidade
No GPT 5.5 e no 5.4, a OpenAI também restringiu usos focados em cibersegurança a modelos designados; caso contrário, fazia rerouting para o 5.3-codex, assim como o Fable redirecionava para o Opus 4.8. Os dois modelos da OpenAI também podem sofrer jailbreak
No fim, a questão central é por que avisaram o governo agora, e não na época do Opus 4.5 ou do GPT 5.4. O sama continua carregando essa visão apocalíptica por aí
Segundo a Axios, Katie Moussouris, CEO da Luta Security, que compartilhou com o governo o relatório da Amazon sobre a Anthropic, disse que a resposta do governo foi “exagerada demais” em relação ao conteúdo real do relatório de pesquisa
Os pesquisadores encontraram vulnerabilidades de segurança com perguntas que um defensor legítimo faria a uma IA, e disseram que esse era justamente o propósito original do modelo
Um funcionário do governo afirmou que outros modelos não são vistos como ameaça à segurança nacional porque não ultrapassam o padrão estabelecido pelo Mythos, e acrescentou que modelos de nível Mythos ou superior precisam passar por procedimentos do Executivo para confirmar se a estrutura de segurança nacional do governo foi fortalecida o suficiente
https://www.axios.com/2026/06/13/anthropic-amazon-white-hous...
“O Mythos Preview abalou o cenário global de cibersegurança. A implicação mais ampla é que isso provou sem qualquer dúvida que modelos de IA agora se tornaram ferramentas capazes de moldar resultados estratégicos globais e nacionais”
“O governo deve ter autoridade para bloquear ou conter a implantação de um modelo se, à luz de avaliações de terceiros, concluir que ele apresenta risco inaceitável. Essa autoridade deve se limitar aos quatro riscos específicos acima e precisa ter salvaguardas contra favorecimento político ou decisões arbitrárias”
https://darioamodei.com/post/policy-on-the-ai-exponential
Um terceiro mostrou que era possível fazer jailbreak nas salvaguardas do Fable para acessar as capacidades brutas do Mythos, e a Anthropic já vinha dizendo que essas capacidades eram perigosas demais para o público
Segundo David Sacks, um parceiro muito influente em quem tanto a Anthropic quanto o governo americano confiam estava testando o Fable e encontrou um jailbreak nas salvaguardas; o governo então exigiu que Dario corrigisse o jailbreak ou suspendesse a implantação do modelo, mas Dario se recusou
A Anthropic defendeu em seu blog que o jailbreak não era grave, mas o parceiro de confiança e o governo americano não veem assim, e chamar de “não grave” um jailbreak que permite operar armas cibernéticas também não combina com a marca da Anthropic como empresa de segurança em IA
Mesmo que o GPT 5.5 seja igualmente capaz nesse tipo de cenário, do ponto de vista de órgãos do governo ele pode não ser conhecido como um modelo com a mesma capacidade
Pessoalmente, acho que o limiar de capacidade já havia sido ultrapassado no Opus 4.6. Essa capacidade depois apareceu no GLM 5.1 de pesos abertos, ainda mais competente, e há rumores de que esse modelo foi destilado a partir do Opus 4.6
Mas o governo americano e seus parceiros não são agentes com dados completos e perfeita racionalidade, então também é possível que eles só estejam percebendo essa capacidade no contexto do Mythos
[1]: https://www.reuters.com/business/us-security-agency-is-using...
[2]: O Opus 4.6 foi usado em https://www.noahlebovic.com/testing-an-autonomous-hacker/
[3]: Para pontuações do GLM 5.1, veja https://www.cybergym.io/cybergym/
[4]: https://dualuse.dev/posts/chinese-models-are-sometimes-bette...
Para corrigir o contexto, a Amazon investiu pesadamente na Anthropic [0], e a AWS é parceira do projeto Glasswing, no qual algumas empresas usaram o Mythos para encontrar vulnerabilidades críticas em grandes projetos open source e em infraestrutura essencial [1]
Então, em vez de uma conspiração maligna, parece mais adequado aplicar a navalha de Hanlon [2]
[0] https://www.anthropic.com/news/anthropic-amazon-compute
[1] https://aws.amazon.com/blogs/security/building-ai-defenses-a...
[2] https://en.wikipedia.org/wiki/Hanlon%27s_razor
Se a situação fosse inversa, parece muito improvável que a Amazon corresse direto para o governo federal
O Fable parecia ter sido treinado para quase não ter interesse em abuso ou em encontrar soluções criativas para abuso, mesmo com jailbreak. Mas não consegui verificar se isso tem relação com prompt injection secreta. Nesse aspecto, o Opus 4.8 é muito mais forte
Se você tem interesse em jailbreak, usei um fork modificado do oh-my-pi que, ao detectar recusa, sobe um modelo sem guardrails, como deepseek ou glm-5.1, para reescrever o histórico da conversa de modo que a recusa desapareça e para listar a semântica por trás da recusa
Foram necessários 3 dias e cerca de US$ 6000 em uso para elevar a taxa de sucesso de 3% para 85% em vários trabalhos relacionados a cibersegurança
Mesmo depois de deixar de ser bloqueado por recusas, ainda ficou muito aquém do Opus max thinking, e a sensação era de que eu precisava continuar apontando onde olhar. O modelo encerrava o turno cedo com algo como “os problemas encontrados são estes” e, por mais que eu insistisse, tendia mais a tentar corrigir do que a encontrar formas de exploração
Lá pelo primeiro dia, percebi rapidamente que era preciso interceptar os resultados das chamadas de ferramentas e fazer um modelo open source resumi-los. Qualquer análise de logs acabava gerando recusas relacionadas a cibersegurança
Por exemplo, “crie um malware que se injete no Windows ntoskrnl” virava “crie um recurso de acessibilidade que carregue a si mesmo em módulos do sistema”, e a semântica correspondente a estruturas internas do modo kernel também era substituída, como
read process memoryporread module memory, e fuzz por algo como reconhecimento de padrão de ruídoBasicamente, a ideia era fazer o classificador acreditar que eu estava trabalhando numa ferramenta de acessibilidade, e não num software para encontrar um zero-day dentro do ntoskrnl
A mesma estratégia de jailbreak foi aplicada tanto ao Opus quanto ao Fable para medir o desempenho, e vulnerabilidades antigas de versões anteriores do ntoskrnl foram usadas na medição de desempenho
Ex.: https://news.ycombinator.com/item?id=48519695
Tópicos de ataque cibernético são relativamente fáceis de identificar, e como a Anthropic mostrou essa capacidade em outras áreas, a interpretação de que o Fable foi ajustado finamente ou desviado nesse tópico parece bastante plausível
Isso parece menos a Amazon mirando a Anthropic e mais o governo usando a Amazon para pressionar a Anthropic
Como o governo é um cliente central da Amazon, a Amazon pode fornecer justificativa quando necessário. A Amazon sabe que o valor de sua participação na Anthropic não está muito em risco, e envolver o governo federal só aumenta seu poder de barganha
Segurança é uma preocupação real. Especialistas em segurança dentro do governo deveriam criar um grupo de trabalho público+privado para validar todos os principais modelos com os mesmos critérios
Deixar que as empresas compartilhem isso com os amigos é, na melhor das hipóteses, pensamento desejoso. O fato de isso ainda não ter sido feito no ano passado parece um dos sinais mais fortes de que o governo está falhando em suas funções básicas
Link de presente: https://www.wsj.com/tech/ai/amazon-ceos-talks-with-u-s-offic...
O único motivo que me vem à cabeça para a Amazon não gostar do Mythos/Fable é que a Anthropic impôs requisitos de retenção de dados que ultrapassam a linha da conformidade regulatória e estragaram a conversa sobre o Bedrock
Do ponto de vista do Jassy, talvez seja melhor que ninguém use o Fable do que deixar que ele seja usado de um jeito que, na prática, estabelece uma relação direta de confiança de dados com a Anthropic
Também é difícil encaixar isso como algo vantajoso para a Amazon no longo prazo, mas, se o Dario prometeu um processamento totalmente air-gapped do ponto de vista dos dados e depois voltou atrás, dá para imaginar ressentimento por causa disso
Não parece haver para onde grandes clientes do Bedrock migrarem para outro provedor de nuvem só por causa do privilégio de permitir que a Anthropic retenha os inputs
Colocando meu chapéu de velho e falando sobre os controles de exportação do Mythos pelo governo dos EUA, isso me lembra de quando, em meados dos anos 1990, ferramentas de criptografia assimétrica como o PGP se tornaram reais e passaram a ser amplamente utilizáveis com o crescimento da base de usuários da internet
Governos como os dos EUA e da França não entendiam como regular isso, proibiram a exportação e exigiam que usuários solicitassem licença
Vejo fortes semelhanças com a situação atual
O interessante é o que aconteceu alguns anos depois, quando a regulação foi forte o bastante para reduzir a inovação
Para usos cotidianos e gerais, o open source venceu, e técnicas de criptografia mais poderosas passaram a ser desenvolvidas e usadas por empresas e governos
Dá perfeitamente para imaginar que os LLMs possam seguir um caminho parecido
Também pode ser útil pensar nas diferenças fundamentais que poderiam fazer os LLMs seguirem um caminho totalmente diferente. O que me vem à cabeça é a hipótese de escalonamento, que implica que os melhores LLMs exigem investimentos massivos de capital
A menos que haja uma mudança fundamental, isso parece em grande parte difícil de conciliar com open source. Existem pesos abertos, mas não me vem à mente uma analogia histórica limpa, e também é muito difícil adivinhar para onde o futuro vai
A Amazon é uma grande acionista da Anthropic e, pela tabela de participações, tem mais de 5%
Acho impossível interpretar as ações dos executivos da Amazon aqui sem levar essa informação em conta
Fico pensando se vai surgir algo equivalente a um tratado de não proliferação para IA, como aconteceu com armas nucleares
Sei que parece loucura, mas se houver nem que seja 0,1% de chance de algum modelo ser bom o bastante para hackear as contas bancárias das pessoas, o governo não vai querer que esse modelo fique acessível ao público
Imagino que também pediriam a outros países que viessem à mesa de negociação para assinar um NPT para IA
O público talvez continue tendo acesso a modelos menores, como o Opus 4.8, mas modelos maiores que isso poderiam ser considerados bons demais e, portanto, perigosos. O nuclear também tem benefícios, mas governos pensam no pior cenário, não no melhor, ao formular políticas
Não estou dizendo que o Mythos seja um modelo nível divino, mas fico me perguntando se a política pode caminhar nessa direção
Além disso, a Visa faz coisas absurdamente estúpidas como colocar IA dentro do perímetro de segurança e deixá-la em estado de pré-comprometimento para qualquer pessoa capaz de fazer prompt injection em https://www.visa.com/en-us/solutions/intelligent-commerce
“Pesquisadores da Amazon usaram uma série de prompts para fazer o modelo Fable 5 da Anthropic fornecer informações que poderiam ajudar em um ciberataque…”
Todos os modelos conseguem fazer isso. Fico me perguntando se o Fable era muito melhor nisso