- A OpenAI disse ao Financial Times que encontrou evidências de que a startup chinesa de IA DeepSeek usou seus modelos proprietários para treinar um modelo concorrente de código aberto
- Suspeita-se que a DeepSeek tenha usado a técnica de "destilação de conhecimento (distillation)", que aproveita a saída de modelos grandes para treinar modelos menores de forma eficiente
- A destilação é uma prática comum no setor de IA, mas a OpenAI afirma que a DeepSeek violou seus termos de serviço ao usá-la para desenvolver um modelo próprio concorrente
- Segundo os termos da OpenAI, os usuários não podem copiar a saída da OpenAI nem usá-la para desenvolver modelos concorrentes
Desempenho dos modelos da DeepSeek e reação do mercado
- O lançamento do modelo de raciocínio R1 da DeepSeek surpreendeu o setor de tecnologia e os investidores
- A DeepSeek vem atraindo atenção do setor ao construir modelos de alto desempenho com custo relativamente baixo
- As ações da Nvidia caíram 17% na segunda-feira, apagando US$ 589 bilhões em valor de mercado, mas se recuperaram 9% na terça-feira
- A queda da Nvidia foi atribuída a temores de redução na demanda por hardware de IA
Resposta da OpenAI e da Microsoft
- A OpenAI e a Microsoft investigaram e bloquearam no ano passado contas suspeitas de que a DeepSeek estivesse usando a API da OpenAI para tentar fazer destilação
- A primeira reportagem sobre isso foi publicada pela Bloomberg
- A Microsoft evitou comentar o caso, e a OpenAI também recusou comentários adicionais
Opinião de especialistas
- David Sacks, ex-responsável por IA e criptomoedas no governo Trump, afirmou que "pode ter havido roubo de propriedade intelectual"
- Alguns pesquisadores de IA analisam que o modelo da DeepSeek mostra sinais de ter aprendido com saídas do GPT-4
- Ritwik Gupta, pesquisador de doutorado em IA na UC Berkeley, explicou que é prática comum no setor de IA usar saídas de LLMs comerciais para treinar modelos
Resposta da OpenAI e perspectivas futuras
- A OpenAI alertou que várias empresas, incluindo da China, estão tentando destilar modelos de empresas americanas de IA
- A empresa enfatizou que decide com cautela divulgar capacidades de ponta de seus modelos para proteger sua propriedade intelectual e que é importante cooperar com o governo dos EUA para evitar vazamento de tecnologia
- No entanto, a própria OpenAI também enfrenta controvérsias de direitos autorais, incluindo processos movidos pelo The New York Times e outros veículos de imprensa e detentores de copyright por suposto uso não autorizado de dados
2 comentários
A OpenAI está em processo com o New York Times; se for assim, a DeepSeek fica livre desse processo? :)
Comentários do Hacker News
Alega-se que é injusto a DeepSeek ter usado dados da OpenAI para treinamento, mas esse argumento é inadequado, já que a própria OpenAI também coletou dados da internet para treinar seus modelos
Há a opinião de que a abertura do código-fonte da DeepSeek e a divulgação sob licença MIT podem se tornar um fator para atrair grandes talentos
O r1 foi criado em um mundo posterior ao o1, e outros modelos podem destilar o r1
Se a DeepSeek foi treinada a partir da OpenAI, então não foi treinada do zero por "pennies on the dollar" e talvez não represente um avanço técnico
A OpenAI está atualmente em uma posição fraca e não pode usar recursos jurídicos como Google ou Microsoft
Assim como no setor ferroviário, também na IA a concorrência pode reduzir custos, e há a possibilidade de a maior parte dos investimentos não gerar grande riqueza
Críticas à OpenAI por usar conteúdo sem permissão e por gastar muito dinheiro para contornar scripts anti-bots de IA
Os modelos da OpenAI foram treinados com base em grandes quantidades de e-books coletados de rastreadores privados de torrents de e-books