OpenAI diz ter obtido evidências de que a DeepSeek usou seus modelos no treinamento

(ft.com)

5 pontos por GN⁺ 2025-01-30 | 2 comentários | Compartilhar no WhatsApp

A OpenAI disse ao Financial Times que encontrou evidências de que a startup chinesa de IA DeepSeek usou seus modelos proprietários para treinar um modelo concorrente de código aberto
Suspeita-se que a DeepSeek tenha usado a técnica de "destilação de conhecimento (distillation)", que aproveita a saída de modelos grandes para treinar modelos menores de forma eficiente
A destilação é uma prática comum no setor de IA, mas a OpenAI afirma que a DeepSeek violou seus termos de serviço ao usá-la para desenvolver um modelo próprio concorrente
Segundo os termos da OpenAI, os usuários não podem copiar a saída da OpenAI nem usá-la para desenvolver modelos concorrentes

Desempenho dos modelos da DeepSeek e reação do mercado

O lançamento do modelo de raciocínio R1 da DeepSeek surpreendeu o setor de tecnologia e os investidores
A DeepSeek vem atraindo atenção do setor ao construir modelos de alto desempenho com custo relativamente baixo
As ações da Nvidia caíram 17% na segunda-feira, apagando US$ 589 bilhões em valor de mercado, mas se recuperaram 9% na terça-feira
A queda da Nvidia foi atribuída a temores de redução na demanda por hardware de IA

Resposta da OpenAI e da Microsoft

A OpenAI e a Microsoft investigaram e bloquearam no ano passado contas suspeitas de que a DeepSeek estivesse usando a API da OpenAI para tentar fazer destilação
A primeira reportagem sobre isso foi publicada pela Bloomberg
A Microsoft evitou comentar o caso, e a OpenAI também recusou comentários adicionais

Opinião de especialistas

David Sacks, ex-responsável por IA e criptomoedas no governo Trump, afirmou que "pode ter havido roubo de propriedade intelectual"
Alguns pesquisadores de IA analisam que o modelo da DeepSeek mostra sinais de ter aprendido com saídas do GPT-4
Ritwik Gupta, pesquisador de doutorado em IA na UC Berkeley, explicou que é prática comum no setor de IA usar saídas de LLMs comerciais para treinar modelos

Resposta da OpenAI e perspectivas futuras

A OpenAI alertou que várias empresas, incluindo da China, estão tentando destilar modelos de empresas americanas de IA
A empresa enfatizou que decide com cautela divulgar capacidades de ponta de seus modelos para proteger sua propriedade intelectual e que é importante cooperar com o governo dos EUA para evitar vazamento de tecnologia
No entanto, a própria OpenAI também enfrenta controvérsias de direitos autorais, incluindo processos movidos pelo The New York Times e outros veículos de imprensa e detentores de copyright por suposto uso não autorizado de dados

2 comentários

botplaysdice 2025-02-01

A OpenAI está em processo com o New York Times; se for assim, a DeepSeek fica livre desse processo? :)

GN⁺ 2025-01-30

Comentários do Hacker News

Alega-se que é injusto a DeepSeek ter usado dados da OpenAI para treinamento, mas esse argumento é inadequado, já que a própria OpenAI também coletou dados da internet para treinar seus modelos
- A afirmação de que a DeepSeek reproduziu do zero um desempenho no nível do o1 pode não ser verdadeira, o que levanta dúvidas sobre a eficiência do treinamento
- O artigo do R1 da DeepSeek mostra que a destilação é muito poderosa, e, se a DeepSeek treinou o modelo usando saídas do o1, isso pode levantar dúvidas sobre a eficiência do treinamento
Há a opinião de que a abertura do código-fonte da DeepSeek e a divulgação sob licença MIT podem se tornar um fator para atrair grandes talentos
- Tornar novas tecnologias open source sempre impulsionou o avanço no passado
- A OpenAI está cooperando com o governo dos EUA para proteger sua propriedade intelectual, e existe a possibilidade de a DeepSeek ser banida como aconteceu com o TikTok
O r1 foi criado em um mundo posterior ao o1, e outros modelos podem destilar o r1
- Há quem diga que destilar a partir do o1 não enfraquece a alegação de custo da DeepSeek
- Há dúvidas sobre se a OpenAI tem alguma superioridade moral ou ética
Se a DeepSeek foi treinada a partir da OpenAI, então não foi treinada do zero por "pennies on the dollar" e talvez não represente um avanço técnico
- Isso ainda não foi confirmado como fato
A OpenAI está atualmente em uma posição fraca e não pode usar recursos jurídicos como Google ou Microsoft
- Há a opinião de que a estratégia da OpenAI de sufocar concorrentes com questões legais não será eficaz
Assim como no setor ferroviário, também na IA a concorrência pode reduzir custos, e há a possibilidade de a maior parte dos investimentos não gerar grande riqueza
- Grandes empresas como Nvidia, OpenAI e DeepSeek investem em IA, mas podem não conseguir gerar lucros reais
Críticas à OpenAI por usar conteúdo sem permissão e por gastar muito dinheiro para contornar scripts anti-bots de IA
- Se a DeepSeek reciclou dados da OpenAI, então isso não seria um avanço de engenharia
Os modelos da OpenAI foram treinados com base em grandes quantidades de e-books coletados de rastreadores privados de torrents de e-books
- Os e-books foram convertidos para o formato epub, organizados e hospedados em repositórios públicos de dados