1 pontos por GN⁺ 5 시간 전 | 6 comentários | Compartilhar no WhatsApp
  • Em cumprimento a uma ordem de controle de exportação emitida pelo governo dos EUA com base em autoridades de segurança nacional, o acesso ao Fable 5 e ao Mythos 5 por todos os cidadãos estrangeiros foi bloqueado, dentro e fora dos Estados Unidos, e o serviço para todos os clientes foi suspenso imediatamente para garantir conformidade
  • A ordem foi recebida às 17h21 ET, e os detalhes específicos das preocupações de segurança nacional não foram informados
  • A justificativa do governo parece ser o reconhecimento de uma técnica de jailbreaking no Fable 5, mas a vulnerabilidade identificada por essa técnica já era conhecida e de baixa gravidade, além de poder ser encontrada sem contornos também em outros modelos públicos
  • Antes do lançamento, a Anthropic realizou milhares de horas de testes de red team com o governo dos EUA, o UK AISI e instituições externas, e nenhum tester encontrou um jailbreak universal
  • A empresa não concorda com o critério de recolher um modelo comercial usado por centenas de milhões de pessoas com base na possibilidade de um jailbreak de escopo limitado, e entende que, se o mesmo padrão fosse aplicado a outros provedores de modelos, a implantação de novos modelos seria praticamente interrompida

Conteúdo da ordem e impacto imediato

  • O governo dos EUA emitiu uma ordem de controle de exportação citando autoridades de segurança nacional, suspendendo o acesso ao Fable 5 e ao Mythos 5 para todos os cidadãos estrangeiros — inclusive funcionários estrangeiros da Anthropic — dentro e fora dos Estados Unidos
  • Como resultado da ordem, a Anthropic desativou repentinamente o Fable 5 e o Mythos 5 para todos os clientes para cumprir a regulamentação
    • O acesso a todos os outros modelos da Anthropic não foi afetado
  • A ordem foi recebida às 17h21 ET naquele dia, e a carta não incluía detalhes específicos das preocupações de segurança nacional

Base estimada para a preocupação do governo

  • Aparentemente, o governo tomou conhecimento de uma técnica de jailbreaking para contornar restrições no Fable 5
  • Ao revisar a demonstração dessa técnica, concluiu-se que ela servia para identificar um pequeno número de vulnerabilidades de baixa gravidade já conhecidas
    • Essas vulnerabilidades são relativamente simples, e podem ser encontradas da mesma forma em outros modelos públicos sem necessidade de contorno

Posição da Anthropic sobre as proteções de segurança do Fable

  • A empresa afirma ter introduzido fortes proteções de segurança que reduzem bastante a possibilidade de uso indevido em tarefas como cibersegurança, a ponto de muitos usuários reclamarem de restrições excessivamente amplas
  • Nas semanas anteriores ao lançamento, realizou ao todo milhares de horas de validação com red team junto ao governo dos EUA, ao UK AISI, a várias instituições privadas terceiras e a equipes internas
  • Segundo a Anthropic, esses testes confirmaram que as proteções do Fable são substancialmente mais eficazes do que as de qualquer modelo já disponibilizado anteriormente
  • Nenhum tester encontrou um jailbreak universal (uma forma de contornar amplamente as proteções do modelo e desbloquear várias capacidades cibernéticas)

Limites da defesa completa contra jailbreak

  • No momento, a empresa considera que nenhum provedor consegue oferecer resistência completa a jailbreak, e que todas as proteções da indústria são vulneráveis a jailbreaks não universais (capazes de induzir, em situações específicas, parte de informações cibernéticas)
    • Também é possível que um jailbreak universal venha a ser descoberto no futuro, algo que já havia sido explicitado no lançamento do Fable 5

Estratégia de Defense in Depth

  • Diante da impossibilidade de uma defesa completa, a empresa adotou uma estratégia de defense in depth, tornando o jailbreak limitado em escopo (não universal) ou muito caro (universal), além de usar monitoramento rigoroso para detectar e bloquear ataques rapidamente
    • Para isso, exigiu no Fable retenção de dados do cliente por 30 dias, o que implica custo real para os clientes, mas permite pesquisa e mitigação de jailbreaks
  • A empresa afirma manter essa estratégia de defesa em camadas, que reduz o risco a um nível comparável ao dos modelos já distribuídos no restante da indústria
  • Diz ainda que não recebeu divulgação de nenhum jailbreak não universal preocupante que tenha levado a resultados nocivos, e que todos os jailbreaks potenciais tornados públicos resultaram apenas em respostas inofensivas ou em descobertas de baixa gravidade sem vantagem específica do Mythos

Verificação das evidências apresentadas ao governo

  • Até o momento, o governo apresentou apenas evidências verbais, envolvendo um jailbreak não universal de escopo restrito no qual se pede ao modelo para ler uma base de código específica e corrigir falhas de software
  • A Anthropic entende que apenas um potencial jailbreak foi compartilhado com o governo e, ao revisar o relatório que supostamente fundamenta a ordem, concluiu que o nível de capacidade apresentado já está amplamente disponível também em outros modelos, como o GPT-5.5 da OpenAI
    • Trata-se de uma capacidade usada diariamente por defensores para proteger sistemas
  • A empresa afirma que compartilhará mais detalhes nas próximas 24 horas

Resposta e posição da Anthropic

  • A Anthropic removeu o acesso ao Fable 5 e ao Mythos 5 para todos os usuários em cumprimento à ordem legal do governo
  • Ainda assim, a empresa discorda de que a descoberta de um potencial jailbreak de escopo limitado seja motivo para recolher um modelo comercial distribuído a centenas de milhões de pessoas
    • Se o mesmo padrão for aplicado a toda a indústria, a implantação de novos modelos por todos os provedores de frontier models será praticamente interrompida
  • A empresa afirma que o governo deve ter autoridade para impedir implantações inseguras, mas isso precisa fazer parte de um processo legal transparente, justo, claro e baseado em fatos técnicos, e que esta medida não atende a esses princípios
  • A Anthropic pede desculpas pela confusão causada aos clientes, considera o caso um mal-entendido e trabalha para restaurar o acesso o mais rapidamente possível

6 comentários

 
clumsily 3 시간 전

Por mais que eu veja isso várias vezes, parece que eles acabaram dando um tiro no próprio pé ao ficar fazendo alarde e dizendo o tempo todo que o nosso modelo era perigoso.
Não sei se isso vai acabar sendo um sucesso ou um fracasso de marketing no futuro, mas por enquanto parece um fracasso.

 
unsure4000 3 시간 전

Considerando a entrada de usuários na Anthropic após o incidente no Pentágono, acho que, neste momento antes do IPO, de jeito nenhum isso acabaria prejudicando a Anthropic.
Também seria perfeito para encobrir questões como as dos guardrails, porque, se desde o início eles simplesmente deixarem de oferecer o modelo como serviço, ele não poderá mais ser verificado.

 
kirinonakar 4 시간 전

As empresas de IA agora não têm mais motivo para desenvolver modelos com melhor desempenho. Parece que o avanço da IA chegou até aqui.

 
lsdcnu 2 시간 전

Que isso... kkk

 
unsure4000 5 시간 전

Incluindo funcionários da Anthropic com nacionalidade estrangeira

kkkkkkkkkkkkkkkkkkkkkkkkkkkkk

 
GN⁺ 5 시간 전
Comentários do Hacker News
  • Eles passaram esse tempo todo fazendo marketing do medo para vender o modelo como se estivesse muito à frente dos outros, então agora estão pagando o preço
    Parece que finalmente encontraram o público certo de tolos para acreditar nisso

    • Às vésperas do IPO, poder tuitar sobre como o modelo deles é assustador e poderoso é boa divulgação para a Anthropic
    • Isso não é um problema só da Anthropic. É uma disputa de poder, e todo mundo que usa essa tecnologia sai perdendo. Não é motivo para comemorar
    • Pagar o preço? Isso é o melhor marketing que eles poderiam desejar
    • Pelo conteúdo, parece bem provável que o governo Trump tivesse mirado a Anthropic mesmo sem esse “marketing do medo”

      Até agora, o que o governo nos apresentou foi apenas evidência verbal de um jailbreak potencialmente restrito e não generalizável e que, em essência, envolve pedir ao modelo para ler uma base de código específica e corrigir falhas de software. Pelo que entendemos, um único jailbreak potencial foi compartilhado com o governo. Nós analisamos esse relatório e confirmamos que o nível de capacidade demonstrado ali é amplamente disponível em outros modelos, incluindo o GPT-5.5 da OpenAI, e é algo usado diariamente por defensores para manter sistemas seguros

    • Era esse tipo de medida que a Anthropic queria, e queria que fosse aplicada a si mesma e a todos os outros fornecedores de modelos de fronteira que lançam modelos poderosos

      Como dissemos publicamente, acreditamos que o governo deve ser capaz de bloquear implantações inseguras como parte de um processo judicial transparente, justo, claro e baseado em fatos técnicos. Esta medida não segue esses princípios
      No fim, eles conseguiram o que queriam

  • Dá para quase ouvir inúmeras empresas e usuários apostando mais forte em modelos chineses
    O acesso de outros países a esses modelos pode ser uma questão de segurança nacional para os EUA. Mas agora a dependência de outros países desses modelos e, de forma mais ampla, da tecnologia americana em geral, também vira a mesma questão de segurança nacional

    • Fico curioso sobre quais modelos estão falando. Queria saber que hipótese mais específica dá para formular. A ideia é que 20% a 50% dos usuários da Anthropic migrem para a DeepSeek?
    • O maior Qwen 3.7 não é um modelo fechado? Também é difícil imaginar que a política chinesa seria menos implacável nesse ponto
    • Esperem só pelo dia em que baixar ou usar modelos chineses vire ilegal; meio brincando, meio sério
  • Do ponto de vista lógico, não sobra outra conclusão além de que os EUA chegaram ao limite superior da capacidade de modelo que permitem liberar ao público, não? Com esse precedente, por que alguém investiria em um modelo mais inteligente?
    Mais importante ainda: se um modelo como o Mythos, que na melhor das hipóteses é uma melhora incremental em relação ao Opus, recebe esse tratamento, como se recupera qualquer investimento em IA baseado na premissa de ASI/AGI/modelos muito melhores?

    • A conclusão mais plausível me parece ser que o governo está irritado com a Anthropic e está fazendo uma retaliação com a ferramenta que tem à mão
      Se OpenAI ou Grok estivessem operando no mesmo nível, provavelmente não levariam essa paulada do governo
    • Não vejo assim. Houve uma época em que até o PlayStation 2 era considerado poderoso demais para exportação: https://www.pcmag.com/news/20-years-later-how-concerns-about...
      O ChatGPT 2 também já foi considerado poderoso demais para ser lançado publicamente
      A IA vem avançando mais rápido do que a cultura e a forma de pensar. Quando nos adaptarmos ao que esses modelos conseguem fazer, a pressão vai aliviar um pouco, e então a próxima melhora gradual vai fazer tudo se repetir. Sempre acontece assim
    • Acho que daqui para frente os melhores modelos de fronteira só serão oferecidos de forma controlada para os ricos
    • Essa “tecnologia” é possível para qualquer um que tenha dinheiro suficiente para treinar novos modelos. Então, independentemente de essa bolha estourar em breve, basta esperar alguns meses e outra pessoa aparecerá com um modelo parecido
      Isso é resultado do espetáculo americano em torno dos grandes modelos de linguagem. Desta vez, só saiu pela culatra
    • 95% de chance de essa medida ser revertida até a manhã de segunda-feira, então essa é a resposta
  • Daqui em diante, sejam os modelos realmente perigosos ou não, as alegações de risco sobre modelos futuros provavelmente vão desaparecer
    Se o governo pode mandar aleatoriamente todos os estrangeiros, dentro e fora dos EUA, pararem de usar um modelo, ninguém vai querer correr o risco de construir algo importante em cima dele. No fim, é só uma questão de tempo até empresas estrangeiras alcançarem e tomarem o mercado comercial desses modelos. Só que, como os EUA costumam fazer, provavelmente vão proibir os concorrentes, então pode acabar acontecendo de, na prática, só nos EUA o backend usar um modelo diferente

    • Isso parece mais o fim do boom dos semicondutores baseado na premissa de “monetizar modelos cada vez maiores”. Se o governo dos EUA pode bloquear a monetização com ordens arbitrárias porque algum modelo “ficou bom demais”, o castelo de cartas inteiro desaba
      Num momento em que isso se soma à escassez global de petróleo, escassez de fertilizantes e intervenções desajeitadas na expansão da bolha, chega a dar para agradecer por o volante estar nas mãos de um stable genius octogenário senil, que despreza o Estado de direito e tem vinte e dois médicos especialistas
    • Lendo o texto, parece bem provável que a prevenção de jailbreak fique muito mais rígida e com muito mais falsos positivos

      Hoje às 17h21 (horário do leste), recebemos uma ordem do governo. A carta não continha detalhes específicos sobre as preocupações de segurança nacional. Pelo que entendemos, o governo acredita ter descoberto uma forma de contornar ou “jailbreakar” o Fable 5. Nós analisamos uma demonstração usada para identificar este método específico, que anteriormente apontou um pequeno número de vulnerabilidades leves. Todas essas vulnerabilidades parecem relativamente simples, e confirmamos que outros modelos públicos também conseguem encontrá-las sem qualquer jailbreak

    • Nesse caso, acho que muitos americanos topariam correr o risco de construir algo importante em cima disso
  • Para grandes empresas ou organizações de certo porte, é difícil demais aceitar o risco de que o núcleo da infraestrutura possa ser desativado de repente por causa de algo assim. A pressão por acesso on-premises e offline vai aumentar de forma esmagadora, e alguém vai atender essa demanda, seja com licença de pesos ou com ambientes restritos como TEE/CC

    • Há grande chance de surgirem vários pontos na fronteira de Pareto
      Alguns vão assumir riscos maiores e ganhar ou perder, enquanto outros vão se mover de forma mais segura e acumular resultados lentamente ou ficar para trás
      Sem nem entrar na ameaça de esses modelos escreverem o código que opera o trabalho da empresa ou passarem a operar como agentes. Pode até ser um modelo treinado por um ator cujos interesses são o completo oposto dos seus, seja uma empresa ou um Estado
      Agora há muito mais coisas a considerar, e é um momento interessante para fazer negócios
    • Concordo que a demanda por acesso on-premises e offline será esmagadora, mas o problema é que a Big AI tornou inviável para a maioria de nós bancar o hardware para rodar isso. Coisas como RAM e NVMe
    • É exatamente por isso que, no longo prazo, acho que os modelos abertos chineses vão vencer. No quadro geral, a diferença de capacidade não é dramática, mas o fato de poder executá-los diretamente é um enorme argumento de venda
      Mesmo que você alugue um modelo aberto de uma empresa chinesa, se cortarem o acesso ou mudarem os termos de um jeito ruim, você pode migrar para on-premises. Pode ser incômodo, mas não ameaça sua sobrevivência. Já depender de um modelo fechado e depois ser cortado significa cair em grande sofrimento
      O ponto central aqui é domínio de infraestrutura. Os modelos chineses vão definir o padrão ao se tornarem os modelos que as pessoas realmente usam. Aí surgem mais pesquisa, mais ferramentas e todo o ecossistema ao redor
      Mesmo antes desta confusão, isso já estava começando, com modelos chineses se tornando os mais usados no mundo. https://www.indiatoday.in/amp/technology/features/story/clau...
  • O amanhecer desta era é visível em toda parte, do Irã aos regimes de verificação etária online, e isto é apenas o começo. O mundo que está por vir será, tecnologicamente, ultramoderno e até futurista, mas estruturalmente parecerá medieval. É o mundo de Frank Herbert. Ele será organizado não pela inclusão universal de todos dentro de um único espaço normativo, mas por zonas sobrepostas de proteção, exploração e acesso controlado
    https://turbulence.substack.com/p/the-gated-age

  • Se você passa muito tempo falando sobre o quanto seu produto é perigoso, as pessoas que têm poder para bloquear produtos perigosos no mercado podem acabar ouvindo isso
    Especialmente se essas pessoas já estiverem irritadas com a Anthropic por ela não estar ajudando a cumprir objetivos autoritários separados e, no momento, não serem exatamente muito inteligentes
    Não acho que isso seja um xadrez 4D da Anthropic. Ao contrário do que gostariam de ser, eles não são estrategistas geniais nos bastidores. Quem realmente usou os produtos sabe que Fable e Mythos não são máquinas do apocalipse, e sim melhorias incrementais. Vejo isto como uma medida punitiva de um governo que gosta de punir, e a Anthropic acabou fortalecendo involuntariamente a justificativa com sua retórica tola

  • Diz que isso aconteceu hoje às 5h21 no horário do Leste
    A página mostrava 11 de junho de 2026 e, nos últimos 10 minutos, foi atualizada para 12 de junho de 2026
    https://imgur.com/a/lx7HCW9
    O Google mostra que essa página foi rastreada há alguns dias
    Basta pesquisar por “the us government directive to suspend access to fable”

    3 days ago — The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5.
    https://imgur.com/a/KQrYPMh

    • Esse é o post do blog de lançamento. O Google provavelmente puxou o trecho da seção Related Content no rodapé, que inclui um texto sobre a diretiva do governo dos EUA
    • Este tópico também aparece do mesmo jeito
      https://imgur.com/a/EOWWUbD
    • De onde veio a informação de que o Google rastreou isso há alguns dias? Captura do imgur é uma das provas mais fracas possíveis. No mínimo, deveria usar archive.today ou capturar a própria evidência de que o Google rastreou isso
  • Analisamos o relatório e confirmamos que o nível de capacidade revelado ali está amplamente disponível em outros modelos, incluindo o GPT-5.5 da OpenAI, e é algo que os defensores que mantêm sistemas seguros usam todos os dias. Compartilharemos mais detalhes nas próximas 24 horas
    Toda a retórica de que Mythos superaria o GPT 5.5 com folga, especialmente em cibersegurança, perde força com isso. Claro, o benchmark da AISI já mostrava isso, mas agora é interessante ver a Anthropic dizer isso quando lhe convém

    • Isso não quer dizer que os outros modelos tenham o mesmo nível de capacidade no geral. Quer dizer que a capacidade específica testada pelo governo também existe em outros modelos
    • Isso diz respeito à capacidade específica que o governo considerou problemática, não à capacidade geral do Fable. Pela minha experiência pessoal usando o Fable esta semana em tarefas muito complexas, ele foi muito mais poderoso do que qualquer outro modelo, pelo menos em engenharia de software
    • Vou ficar realmente irritado se 5.5 for proibido por causa disso
    • A comparação com outros modelos se limita aos problemas que, no caso do governo, foram concluídos via jailbreak, e não a todas as vulnerabilidades exploráveis sem contorno
  • Mesmo para funcionários da Anthropic nos EUA, impedir que cidadãos estrangeiros usem isso, independentemente do país de origem, parece excessivamente amplo e severo. Ainda mais por causa de uma única vulnerabilidade potencial de jailbreak aparentemente trivial; há algo mais aí do que parece

    • Parece que o escopo de quem pode continuar usando está alinhado com outros controles de exportação dos EUA, como ITAR ou EAR
    • Sim. Este governo não é exatamente famoso pela sutileza…
    • Infelizmente, é assim que controles de exportação costumam funcionar. Mesmo trabalhando em um laboratório nacional, pesquisadores estrangeiros não são admitidos em áreas ligadas à segurança nacional, porque essa é a medida de segurança mais fácil de adotar
      Isso não quer dizer que seja bom para os pesquisadores nem para a própria pesquisa. É mais como um seguro sobre o uso de verbas determinado pelo governo dos EUA
    • Também há um ressentimento remanescente entre o DoD e a Anthropic. Considerando o nível geral de maturidade da cúpula do governo dos EUA, dá para apostar bastante na hipótese de que o Mythos virou uma boa desculpa para a turma do Hegseth se vingar