5 pontos por GN⁺ 2025-01-30 | 2 comentários | Compartilhar no WhatsApp
  • A OpenAI disse ao Financial Times que encontrou evidências de que a startup chinesa de IA DeepSeek usou seus modelos proprietários para treinar um modelo concorrente de código aberto
  • Suspeita-se que a DeepSeek tenha usado a técnica de "destilação de conhecimento (distillation)", que aproveita a saída de modelos grandes para treinar modelos menores de forma eficiente
  • A destilação é uma prática comum no setor de IA, mas a OpenAI afirma que a DeepSeek violou seus termos de serviço ao usá-la para desenvolver um modelo próprio concorrente
  • Segundo os termos da OpenAI, os usuários não podem copiar a saída da OpenAI nem usá-la para desenvolver modelos concorrentes

Desempenho dos modelos da DeepSeek e reação do mercado

  • O lançamento do modelo de raciocínio R1 da DeepSeek surpreendeu o setor de tecnologia e os investidores
  • A DeepSeek vem atraindo atenção do setor ao construir modelos de alto desempenho com custo relativamente baixo
  • As ações da Nvidia caíram 17% na segunda-feira, apagando US$ 589 bilhões em valor de mercado, mas se recuperaram 9% na terça-feira
  • A queda da Nvidia foi atribuída a temores de redução na demanda por hardware de IA

Resposta da OpenAI e da Microsoft

  • A OpenAI e a Microsoft investigaram e bloquearam no ano passado contas suspeitas de que a DeepSeek estivesse usando a API da OpenAI para tentar fazer destilação
  • A primeira reportagem sobre isso foi publicada pela Bloomberg
  • A Microsoft evitou comentar o caso, e a OpenAI também recusou comentários adicionais

Opinião de especialistas

  • David Sacks, ex-responsável por IA e criptomoedas no governo Trump, afirmou que "pode ter havido roubo de propriedade intelectual"
  • Alguns pesquisadores de IA analisam que o modelo da DeepSeek mostra sinais de ter aprendido com saídas do GPT-4
  • Ritwik Gupta, pesquisador de doutorado em IA na UC Berkeley, explicou que é prática comum no setor de IA usar saídas de LLMs comerciais para treinar modelos

Resposta da OpenAI e perspectivas futuras

  • A OpenAI alertou que várias empresas, incluindo da China, estão tentando destilar modelos de empresas americanas de IA
  • A empresa enfatizou que decide com cautela divulgar capacidades de ponta de seus modelos para proteger sua propriedade intelectual e que é importante cooperar com o governo dos EUA para evitar vazamento de tecnologia
  • No entanto, a própria OpenAI também enfrenta controvérsias de direitos autorais, incluindo processos movidos pelo The New York Times e outros veículos de imprensa e detentores de copyright por suposto uso não autorizado de dados

2 comentários

 
botplaysdice 2025-02-01

A OpenAI está em processo com o New York Times; se for assim, a DeepSeek fica livre desse processo? :)

 
GN⁺ 2025-01-30
Comentários do Hacker News
  • Alega-se que é injusto a DeepSeek ter usado dados da OpenAI para treinamento, mas esse argumento é inadequado, já que a própria OpenAI também coletou dados da internet para treinar seus modelos

    • A afirmação de que a DeepSeek reproduziu do zero um desempenho no nível do o1 pode não ser verdadeira, o que levanta dúvidas sobre a eficiência do treinamento
    • O artigo do R1 da DeepSeek mostra que a destilação é muito poderosa, e, se a DeepSeek treinou o modelo usando saídas do o1, isso pode levantar dúvidas sobre a eficiência do treinamento
  • Há a opinião de que a abertura do código-fonte da DeepSeek e a divulgação sob licença MIT podem se tornar um fator para atrair grandes talentos

    • Tornar novas tecnologias open source sempre impulsionou o avanço no passado
    • A OpenAI está cooperando com o governo dos EUA para proteger sua propriedade intelectual, e existe a possibilidade de a DeepSeek ser banida como aconteceu com o TikTok
  • O r1 foi criado em um mundo posterior ao o1, e outros modelos podem destilar o r1

    • Há quem diga que destilar a partir do o1 não enfraquece a alegação de custo da DeepSeek
    • Há dúvidas sobre se a OpenAI tem alguma superioridade moral ou ética
  • Se a DeepSeek foi treinada a partir da OpenAI, então não foi treinada do zero por "pennies on the dollar" e talvez não represente um avanço técnico

    • Isso ainda não foi confirmado como fato
  • A OpenAI está atualmente em uma posição fraca e não pode usar recursos jurídicos como Google ou Microsoft

    • Há a opinião de que a estratégia da OpenAI de sufocar concorrentes com questões legais não será eficaz
  • Assim como no setor ferroviário, também na IA a concorrência pode reduzir custos, e há a possibilidade de a maior parte dos investimentos não gerar grande riqueza

    • Grandes empresas como Nvidia, OpenAI e DeepSeek investem em IA, mas podem não conseguir gerar lucros reais
  • Críticas à OpenAI por usar conteúdo sem permissão e por gastar muito dinheiro para contornar scripts anti-bots de IA

    • Se a DeepSeek reciclou dados da OpenAI, então isso não seria um avanço de engenharia
  • Os modelos da OpenAI foram treinados com base em grandes quantidades de e-books coletados de rastreadores privados de torrents de e-books

    • Os e-books foram convertidos para o formato epub, organizados e hospedados em repositórios públicos de dados