1 pontos por GN⁺ 2025-01-30 | 1 comentários | Compartilhar no WhatsApp
  • Motivos para o DeepSeek ser open source

    • A DeepSeek é um laboratório chinês de pesquisa em IA que desenvolveu o R1, um modelo de raciocínio open source.
    • Desenvolveu um modelo com desempenho semelhante ao da OpenAI a um custo baixo, graças a métodos de treinamento inovadores.
    • Por ser uma empresa chinesa, precisava adotar o open source para conquistar confiança no mercado ocidental.
    • Open source não é apenas uma ação técnica, mas também uma ação cultural.
  • Comoditização dos modelos

    • Os modelos de LLM estão se tornando cada vez mais comoditizados, e a diferença de desempenho não é grande.
    • A OpenAI ainda é líder, mas modelos open source como o DeepSeek R1 oferecem custos mais baixos.
    • Em infraestrutura, o open source tende a vencer no longo prazo.
  • Vantagens do open source em infraestrutura

    • Open source é mais barato e permite personalização, mas exige manutenção.
    • Infraestrutura sempre precisa de customização, e quanto mais técnico for o produto, mais os engenheiros tendem a preferir open source.
    • O motivo do sucesso de empresas open source como a Lago é que engenheiros podem gerenciar diretamente sistemas de cobrança complexos.
  • O futuro da OpenAI

    • A OpenAI ainda ocupa uma posição importante no mercado e segue liderando em LLMs e modelos de raciocínio.
    • Há quem diga que modelos como o DeepSeek R1 podem substituir a OpenAI, mas sem as inovações da OpenAI esses modelos talvez nem existissem.
    • O R1 pode incentivar grandes empresas já estabelecidas a buscar métodos mais eficientes.

1 comentários

 
GN⁺ 2025-01-30
Opinião do Hacker News
  • Entre as grandes startups chinesas de modelos, apenas a DeepSeek escolheu o código aberto sem priorizar a comercialização. Isso acabou gerando divulgação orgânica de usuários dentro da comunidade.

    • O CEO da DeepSeek argumenta que o código aberto atrai os melhores talentos e aumenta o valor da equipe.
    • Isso é semelhante à estratégia que a OpenAI seguia no passado, antes de se tornar a divisão ClosedAI da Microsoft.
  • APIs chinesas de IA provavelmente serão recebidas com ceticismo no Ocidente. Há razões historicamente justificáveis para isso.

    • A DeepSeek é criticada por censurar perguntas sensíveis relacionadas à China.
  • Segundo um memorando interno do Google, o código aberto está evoluindo mais rápido e com mais eficiência do que equipes fechadas.

    • O futuro dos LLMs está na pesquisa compartilhada, e isso parece muito importante.
  • Argumenta-se que uma empresa com "Open" no nome deveria compartilhar as partes importantes, mesmo que não compartilhe tudo.

    • Como o código-fonte não é fornecido, na prática isso não é open source.
  • Assim como o Linux teve sucesso no longo prazo, espera-se que modelos LLM poderosos sigam o mesmo caminho.

    • No fim, a escala da infraestrutura será o diferencial.
  • A DeepSeek é um projeto paralelo de um fundo hedge, e há a possibilidade de obter grandes lucros vendendo ações da NVIDIA a descoberto e divulgando tudo.

  • A razão para tornar a DeepSeek open source é que desenvolvedores querem mostrar algo incrível que criaram.

    • Muitas pessoas tentam encontrar uma motivação financeira, mas quem realmente fez isso são engenheiros, não empresários. A DeepSeek é de fato um projeto muito incrível, e eles quiseram mostrar essa criação impressionante.