- Antes de uma audiência do Senado dos EUA sobre IA, a Anthropic afirmou que a atividade ligada à Alibaba foi o maior caso desse tipo de ataque já direcionado à empresa
- O método central foi a destilação (distillation), em que um modelo mais fraco é treinado com as saídas de um modelo mais forte; a Anthropic acredita que isso pode permitir que a China alcance mais rapidamente capacidades de nível Mythos Preview
- Entre 22 de abril de 2026 e 5 de junho, houve mais de 28,8 milhões de interações com o Claude, e quase 25 mil contas fraudulentas teriam sido usadas
- A Anthropic afirmou que os operadores estão ligados à Alibaba e ao laboratório de IA Alibaba Qwen; a Alibaba não respondeu imediatamente ao pedido de comentário da Reuters
- A Anthropic apoia o compartilhamento de inteligência sobre ameaças entre o governo dos EUA e empresas privadas de IA, além de respostas conjuntas, mas no mesmo período também foram impostas restrições de acesso aos seus modelos Mythos e Fable
Alegação de extração ilegal ligada à Alibaba
- Em uma carta enviada ao Senado dos EUA, a Anthropic afirmou que a empresa chinesa de tecnologia e comércio eletrônico Alibaba extraiu ilegalmente capacidades dos modelos de IA Claude
- Segundo a carta vista pela Reuters, a Anthropic considerou essa atividade o maior caso desse tipo de ataque já identificado pela empresa
- A Alibaba não respondeu imediatamente ao pedido de comentário da Reuters
Método de destilação e escala do ataque
- A Anthropic classificou a atividade como uma tentativa de destilação (distillation)
- Destilação é o método de treinar um modelo relativamente menos capaz usando as saídas de um modelo mais poderoso
- O período da campanha foi de 22 de abril de 2026 a 5 de junho
- Nesse intervalo, foram contabilizadas mais de 28,8 milhões de interações direcionadas ao Claude
- Quase 25 mil contas fraudulentas foram usadas
- A Anthropic acredita que a destilação é uma forma de acelerar a chegada da China a capacidades avançadas de nível Mythos Preview da Anthropic
Alegação de vínculo com Alibaba Qwen e destinatários da carta
- A Anthropic afirmou que a campanha foi conduzida por operadores ligados à Alibaba e ao laboratório de IA da empresa, Alibaba Qwen
- A carta é datada de 10 de junho
- Os destinatários são o presidente e a principal integrante da minoria no Comitê Bancário do Senado dos EUA, Tim Scott e Elizabeth Warren
- A carta foi enviada antes da audiência sobre IA programada
Casos anteriores envolvendo institutos chineses de IA
- A Anthropic já havia dito, em fevereiro de 2026, que identificou uma campanha em que a startup chinesa de IA DeepSeek e outros dois institutos chineses de IA tentaram extrair ilegalmente capacidades da plataforma Claude AI
- Na ocasião, a escala apresentada pela Anthropic foi a seguinte
- DeepSeek: mais de 150 mil interações
- Moonshot AI: mais de 3,4 milhões
- MiniMax: mais de 13 milhões
- Na época, a Anthropic afirmou que a intensidade e a sofisticação dessas campanhas estavam aumentando, exigindo uma resposta rápida e coordenada da indústria, de formuladores de políticas e da comunidade global de IA
Medidas do governo dos EUA e restrições aos modelos da Anthropic
- A Anthropic declarou apoiar os esforços de resposta do governo dos EUA
- Incluindo o compartilhamento de inteligência sobre ameaças com empresas privadas de IA
- E outras atividades de resposta conjunta
- Em abril de 2026, a Casa Branca acusou a China de roubar propriedade intelectual de laboratórios de IA dos EUA em escala industrial
- No mesmo mês, a Alibaba foi adicionada à lista do Departamento de Defesa dos EUA de empresas militares chinesas, e a empresa contesta essa designação
- O Departamento de Comércio dos EUA adiou a inclusão da DeepSeek em uma lista negra comercial, apesar de ela ter sido considerada um risco à segurança nacional por um comitê interagências do governo, numa tentativa de evitar maior tensão com Beijing
- Em 12 de junho, dois dias após o envio da carta pela Anthropic, o Departamento de Comércio dos EUA impôs restrições aos mais recentes modelos de IA Mythos e Fable da Anthropic
- As autoridades temem que esses modelos possam ser implantados para usuários de inteligência militar na China e em outros países considerados preocupantes
- Com essa restrição, a Anthropic desativou globalmente o acesso a esses modelos
1 comentários
Comentários do Hacker News
Deixo isto aqui: “um juiz decidiu que o download de mais de 7 milhões de livros feito pela Anthropic em sites piratas como o LibGen constitui infração, e também rejeitou a defesa da Anthropic de ‘finalidade de pesquisa’: ‘você não pode se abençoar dizendo que é para pesquisa e depois pegar qualquer livro didático que quiser.’”
https://www.joneswalker.com/en/insights/blogs/ai-law-blog/wh...
Existem basicamente dois tipos de destilação. 1) a forma burra em larga escala, de fazer perguntas e usar respostas como sinal de reforço (caixa-preta), 2) uma destilação mais direcionada, em que um modelo ensina, treina e orienta diretamente o outro (RLAIF)
A segunda, na prática, é ajustar finamente um modelo guiado pela orientação de outro. Inúmeras empresas fazem esse tipo de ajuste fino todos os dias. Institutos de pesquisa chineses quase certamente também usam esse método, porque ele é muito mais eficaz no resultado final do que simplesmente raspar respostas simples para perguntas simples
Essas reclamações sobre destilação parecem tentar fazer o problema parecer maior do que realmente é, e o objetivo aparenta ser protecionista: levar o governo dos EUA a bloquear ou proibir provedores de modelos chineses. Já pediram um endurecimento dos controles de exportação de chips, o que é engraçado considerando que o DeepSeek v4 foi projetado para rodar em chips da Huawei e outras empresas chinesas estão seguindo o mesmo caminho. Mas como não podem dizer isso abertamente, afirmam que modelos destilados podem não ser tão seguros quanto os deles, então pedem mais controles de exportação. Mas, quando você mostra jailbreaks que contornam as proteções de segurança do próprio modelo deles, dizem que não é preciso se preocupar com segurança, porque qualquer modelo acaba sendo jailbreakado
2) é impossível criar um modelo de linguagem de grande porte imune a todos os jailbreaks. Também não há evidência confiável para refutar isso, então a Anthropic está totalmente certa
Se a afirmação 1 for falsa, basta divulgar os detalhes do jailbreak. Como supostamente só funciona no Fable 5, também não haveria risco real
Se a afirmação 2 for falsa, algum outro laboratório de modelos de linguagem de grande porte já deveria ter conseguido isso. Ainda mais porque vários governos já deixaram claro que existe mercado para esse tipo de projeto
No fundo, é muito difícil impedir isso sem deixar o modelo de IA menos útil
Isso me lembra quando, no fim dos anos 1980, Steve Jobs reclamava de terem copiado a GUI do Mac. Só que ele próprio não reconhecia publicamente o trabalho feito no Xerox Alto e no sistema operacional Star
“Você está tentando copiar o que eu já copiei!”
É o mesmo que rastejar a internet inteira para criar um modelo de linguagem gigante e depois reclamar de ser copiado
A informação realmente quer ser livre, mas as empresas de IA querem ser as porteiras. No longo prazo, acho que a abordagem mais sustentável, de pesos abertos, vai vencer
É realmente engraçado ver a hipocrisia de a Anthropic reclamar que “extraiu ilegalmente as capacidades do modelo Claude AI” e endossar a acusação da Casa Branca de que a China “rouba propriedade intelectual de laboratórios de IA dos EUA em escala industrial”
Anthropic, OpenAI, Google, Microsoft etc. treinaram seus modelos coletando conteúdo indiscriminadamente e ignorando os direitos dos detentores de copyright. Agora uma delas está gritando que é injusto quando outro ator fez a mesma coisa que todas elas fizeram?
robots.txte fazer os custos de banda dispararem. Mas se as práticas de coleta de dados geram custos para os provedores de IA, aí isso claramente se torna inaceitávelO que está acontecendo agora é o seguinte: revendedores chineses estão oferecendo tokens do Claude por preços 70% a 90% menores que os da API oficial da Anthropic. Eles conseguem isso agrupando contas Claude Max e revendendo a capacidade, usando fraude de pagamento e revendendo saídas do modelo e cadeias de raciocínio para vários laboratórios chineses. Ao ajudar no acesso ao modelo em troca de logs de usuários e rastros de raciocínio, eles podem vender isso como dados de treinamento e operar abaixo do custo
Claude e ChatGPT estão ambos bloqueados na China. Para acessar, é preciso VPN, e não dá para pagar com cartão bancário chinês. Então a maioria das pessoas que quer acesso ao Claude compra acesso por meio de revendedores
É a forma mais fácil e barata de acessar os modelos da Anthropic na China
Esses revendedores operam dezenas de milhares de contas de bot, e é por isso que a Anthropic introduziu verificação de identidade para tentar desacelerar a ofensiva dos bots
Um revendedor de tokens oferece o Opus 4.8 com 93% de desconto em relação à tarifa oficial da API: https://yunwu.ai/pricing?provider=Anthropic
Essa é uma das razões pelas quais os preços do DeepSeek e do GLM são tão baixos. Como precisam competir com preços de tokens absurdamente baixos na China, têm de manter os preços baixos para que as pessoas usem
Compartilhei isso alguns meses atrás, mas não teve muita repercussão. É um ótimo texto explicando a economia de revenda de tokens na China: https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens...
Também aprendi que, se a Anthropic quiser competir, precisa fazer melhor o próprio trabalho
Senão, alguém vai vencer
Agora esse princípio não se aplica às grandes empresas americanas?
DeepSeek e GLM têm pesos abertos, e até provedores americanos de inferência vendem bem mais barato. O motivo de o preço ser baixo é que os modelos são mais eficientes
Se não, isso soa como aquele argumento comum dos pessimistas de IA de que “Anthropic/OpenAI está vendendo US$ 1.000 em tokens por US$ 100 e perdendo uma fortuna”
A conduta da Alibaba está sendo descrita como um esforço de “destilação”, que a Anthropic definiu como treinar um modelo mais fraco com as saídas de um modelo mais forte
O Claude usou terabytes de conteúdo sem permissão para treinar o próprio modelo, e isso teria sido aceitável. Agora alguém usa a saída do modelo Claude para treinar um modelo e eles estão gritando que é injusto
Vai ser interessante ver um julgamento em que a Anthropic tenha de revelar a origem dos dados de treinamento e explicar por que ela pode cobrar dos clientes por dados de treinamento regurgitados, mas a Alibaba não pode treinar seu modelo com o modelo da Anthropic
Deve ser divertido
A ação da Anthropic parece um gesto performático. Outros já especularam quem seria o público-alvo
O que exatamente seria ilegal aqui?
Legalmente, a saída do modelo não pode ser protegida como propriedade intelectual, nem pela legislação doméstica nem pela internacional. No máximo, o que se poderia esperar é algum tipo de reparação civil, e mesmo isso é forçado, considerando que a própria forma como eles treinaram o modelo era literalmente ilegal
A Anthropic foi tratada exatamente da forma como tratou todo mundo. Eles fizeram a própria cama, então agora têm de deitar nela
O que a Alibaba fez é chamado de “destilação”, isto é, treinar um modelo mais fraco com as saídas de um modelo mais forte, e eu não entendo o que há de errado nisso
A Anthropic disse que essa campanha ocorreu de 22 de abril de 2026 a 5 de junho e gerou mais de 28,8 milhões de interações com o Claude por meio de quase 25.000 contas fraudulentas
O que torna essas contas fraudulentas? Se pagaram o preço combinado, não estaria tudo bem? Se não pagaram, por que a Anthropic forneceu o serviço?
A destilação é fundamentalmente impossível de impedir. Tudo o que dá para fazer é atrasar. Tente refutar
No fim, empresas chinesas vão lançar extensões como o Honey, se apoiar em clientes reais não chineses e, de qualquer forma, mandar tudo para a China
Acabou
Mas os laboratórios de IA ainda podem continuar gerando enorme valor econômico sem expor seus modelos a uma potencial destilação por meio de lançamento público. Por exemplo, podem usar o modelo apenas internamente para desenvolver tratamentos
Espero que um dia exista um futuro em que outros também possam acessar modelos de ponta, mas isso não é necessariamente indispensável se a conclusão for que impedir a difusão via destilação é mais importante
[1]: referência sobre destilação em https://dualuse.dev/posts/export-controls-on-fable
O ponto é que talvez não exista solução técnica, mas teoricamente pode haver uma solução política
“False Promise of Imitating Proprietary LLMs”, de Berkeley, também concluiu que a imitação reduz rapidamente a lacuna de estilo, mas a lacuna de capacidade permanece grande
https://arxiv.org/abs/2305.15717