- A startup chinesa de IA DeepSeek teria usado chips Nvidia Blackwell sujeitos à proibição de exportação dos EUA para desenvolver sua próxima geração de modelos de IA
- O The Information informou que esses chips foram contrabandeados para a China após serem desmontados em data centers de países terceiros onde a venda é permitida
- Os EUA proíbem a exportação para a China de semicondutores avançados, e alguns desenvolvedores estariam acessando esses chips por meio de data centers no exterior ou rotas alternativas
- A Nvidia disse, sobre a reportagem, que “não confirmou esse tipo de operação” e afirmou que investigará caso receba denúncias
- O caso mostra, em meio à competição tecnológica entre EUA e China, a realidade de empresas chinesas de IA buscando garantir chips de alto desempenho
Suspeita de uso de chips proibidos pela DeepSeek
- O The Information informou que a DeepSeek usou chips Nvidia Blackwell, proibidos para exportação pelos EUA, para desenvolver um novo modelo de IA
- Esses chips teriam sido instalados em data centers de países onde a venda é permitida, depois desmontados e transportados para a China
- A reportagem diz que eles foram levados ao país após passarem por inspeções de empresas que desenvolvem equipamentos de servidor
- Os EUA proíbem a exportação para a China desses semicondutores avançados
- Com isso, há casos de desenvolvedores de IA na China obtendo chips por meio de data centers no exterior ou rotas informais
Restrições de exportação dos EUA e casos relacionados
- Em novembro, promotores dos EUA indiciaram dois chineses e dois americanos
- Eles são acusados de criar uma empresa imobiliária de fachada para transportar chips para a China via Malásia
- Esses casos são citados como parte de transações indiretas surgidas após o fortalecimento dos controles de exportação de semicondutores pelos EUA
A posição da Nvidia
- A Nvidia afirmou que nunca recebeu confirmação nem denúncia sobre esse tipo de contrabando
- Um porta-voz disse que, “se esse contrabando for real, parece pouco provável, mas investigaremos se chegarem denúncias”
Contexto da DeepSeek e desenvolvimento de modelos de IA
- Em janeiro de 2024, a DeepSeek anunciou que havia desenvolvido a baixo custo um modelo de IA capaz de competir com os melhores do Vale do Silício
- A empresa recebeu financiamento do hedge fund chinês High-Flyer e teria garantido 10 mil GPUs da Nvidia em 2021
- Isso ocorreu antes das medidas de proibição de exportação dos EUA
- Em setembro de 2024, a empresa apresentou um novo modelo e disse que está cooperando com fabricantes de chips chineses
Medidas mais recentes dos EUA e resposta da China
- O presidente Donald Trump permitiu no início desta semana a exportação para a China do acelerador de IA H200 mais antigo da Nvidia
- No entanto, a proibição de exportação dos chips Blackwell mais poderosos continua em vigor
- O governo chinês tem incentivado empresas de tecnologia do país a ampliar o uso de equipamentos nacionais
- A DeepSeek também está cooperando com fabricantes chineses de chips em linha com esse movimento
1 comentários
Opiniões do Hacker News
Já era sabido que a DeepSeek treinou o modelo com chips Nvidia obtidos antes da proibição dos EUA à exportação de semicondutores para o público
Alguns acham que ela também pode ter conseguido chips depois disso por canais não oficiais
Também li em outro lugar que usaram dados de saída do ChatGPT, Claude e Gemini como dados de treinamento
Como é uma estrutura em que roubam de novo dados já roubados entre si, um pouco de contrabando nem surpreende
Até o próprio presidente admitiu que os EUA fazem esse tipo de sanção por protecionismo
A Anthropic também pagou US$ 1 bilhão em acordo por violação de direitos autorais, e no fim todos os modelos são resultado de apropriação em massa da propriedade intelectual e dos dados pessoais da humanidade
Apoio a crença de que modelos abertos vencem os fechados
Só que os TOS da OpenAI proíbem usar isso para treinar modelos concorrentes, o que é irônico
Usar a saída de outros modelos no treinamento é chamado de destilação de conhecimento (distillation)
Modelos antigos do Grok também costumavam começar respostas com “as a model trained by OpenAI...”
O documentário da GamersNexus explica bem como funciona o mercado negro de GPUs de IA da NVIDIA
Ele aborda como empresas como a DeepSeek conseguem chips burlando a proibição de exportação dos EUA
O comprador final era uma conta australiana, mas o endereço de entrega era uma casa comum em Delaware, nos EUA, e o nome também era diferente
Dizem que nesses casos normalmente estudantes chineses no exterior ou imigrantes compram GPUs para revender
Provavelmente minha 4090 vai renascer na China como uma GPU Frankenstein com VRAM modificada
Depois que cruza a fronteira, a GPU já está dentro da China
Só é “contrabando” durante a entrada; uma vez dentro da China, não é ilegal
É natural que a DeepSeek use GPUs assim
As sanções só aumentam um pouco o custo, não tornam algo impossível
Componentes eletrônicos, petróleo e até acesso ao ChatGPT acabam sendo possíveis se houver dinheiro
Mas itens sancionados assim também podem ser usados como ferramenta de propaganda
Por exemplo, imagino como seria se ao instalar o driver da Nvidia fosse preciso responder perguntas sobre o “Incidente da Praça da Paz Celestial”
Transportar um caminhão cheio de GPUs é bem mais simples do que drogas
Só que isso é proibido em plataformas públicas
Por isso, fico na dúvida sobre o quanto essa estratégia de propaganda seria realmente eficaz
Mesmo sem barrar totalmente a frota russa de contrabando de petróleo, o clima de medo já pode reduzir os lucros
A Bloomberg descreveu como “chips proibidos na China”, mas
os EUA proibirem a exportação não é a mesma coisa que serem proibidos dentro da China
Artigo relacionado (Al Jazeera)
Por exemplo, houve muitos casos em que tentaram prender e extraditar no exterior operadores de sites de torrent ou pessoas ligadas ao WikiLeaks
Chegaram até a justificar sequestro e tortura de estrangeiros sob o pretexto de serem “combatentes inimigos”
Acho que o mundo teria sido melhor se os EUA não ficassem reprimindo outros países
Toda grande potência tem o instinto de preservar sua posição
As sanções dos EUA são menos um simples protecionismo e mais uma resposta à concorrência desleal
Acho estranho que nessa discussão ninguém tenha mencionado acessibilidade de nuvem
Era possível alugar H100 em servidores dos EUA sem nenhuma restrição
É difícil para um usuário comum conseguir infraestrutura nesse nível
Talvez nem precisasse reiniciar
Isso nem é surpreendente, e provavelmente não vai acontecer nada
Se o local de fabricação fica no país ao lado, sempre existe um jeito de conseguir chips
A menos que se proíba totalmente as vendas internacionais da Nvidia, as sanções têm pouca efetividade
Também seria irrealista o governo passar a controlar compra de GPU por sistema de licença
A postura de “fechar um olho e deixar o outro aberto” mencionada pela GamersNexus está correta
A China mandou parar de usar chips da Nvidia, mas na prática isso está mais para um sinal para incentivar autossuficiência
As sanções dos EUA, como a guerra às drogas, são uma política fadada ao fracasso
Claro, seria ainda melhor se fosse participação espontânea e não coerção
Se os chips usados desta vez foram comprados legalmente antes da proibição,
no fim pode ser uma polêmica sem importância
Havia rumores de que a DeepSeek evitou sanções e reduziu custos ao fazer bootstrap dos parâmetros de outros modelos
Esta reportagem reforça esses rumores
Acho difícil, na prática, impedir comércio entre os dois países
GPUs são bens com baixo volume de circulação e que não podem ser rastreados por satélite,
então são diferentes de itens como petróleo, cuja infraestrutura fica exposta