A necessidade de tornar o DeepSeek open source

(getlago.com)

1 pontos por GN⁺ 2025-01-30 | 1 comentários | Compartilhar no WhatsApp

Motivos para o DeepSeek ser open source
- A DeepSeek é um laboratório chinês de pesquisa em IA que desenvolveu o R1, um modelo de raciocínio open source.
- Desenvolveu um modelo com desempenho semelhante ao da OpenAI a um custo baixo, graças a métodos de treinamento inovadores.
- Por ser uma empresa chinesa, precisava adotar o open source para conquistar confiança no mercado ocidental.
- Open source não é apenas uma ação técnica, mas também uma ação cultural.
Comoditização dos modelos
- Os modelos de LLM estão se tornando cada vez mais comoditizados, e a diferença de desempenho não é grande.
- A OpenAI ainda é líder, mas modelos open source como o DeepSeek R1 oferecem custos mais baixos.
- Em infraestrutura, o open source tende a vencer no longo prazo.
Vantagens do open source em infraestrutura
- Open source é mais barato e permite personalização, mas exige manutenção.
- Infraestrutura sempre precisa de customização, e quanto mais técnico for o produto, mais os engenheiros tendem a preferir open source.
- O motivo do sucesso de empresas open source como a Lago é que engenheiros podem gerenciar diretamente sistemas de cobrança complexos.
O futuro da OpenAI
- A OpenAI ainda ocupa uma posição importante no mercado e segue liderando em LLMs e modelos de raciocínio.
- Há quem diga que modelos como o DeepSeek R1 podem substituir a OpenAI, mas sem as inovações da OpenAI esses modelos talvez nem existissem.
- O R1 pode incentivar grandes empresas já estabelecidas a buscar métodos mais eficientes.

1 comentários

GN⁺ 2025-01-30

Opinião do Hacker News

Entre as grandes startups chinesas de modelos, apenas a DeepSeek escolheu o código aberto sem priorizar a comercialização. Isso acabou gerando divulgação orgânica de usuários dentro da comunidade.
- O CEO da DeepSeek argumenta que o código aberto atrai os melhores talentos e aumenta o valor da equipe.
- Isso é semelhante à estratégia que a OpenAI seguia no passado, antes de se tornar a divisão ClosedAI da Microsoft.
APIs chinesas de IA provavelmente serão recebidas com ceticismo no Ocidente. Há razões historicamente justificáveis para isso.
- A DeepSeek é criticada por censurar perguntas sensíveis relacionadas à China.
Segundo um memorando interno do Google, o código aberto está evoluindo mais rápido e com mais eficiência do que equipes fechadas.
- O futuro dos LLMs está na pesquisa compartilhada, e isso parece muito importante.
Argumenta-se que uma empresa com "Open" no nome deveria compartilhar as partes importantes, mesmo que não compartilhe tudo.
- Como o código-fonte não é fornecido, na prática isso não é open source.
Assim como o Linux teve sucesso no longo prazo, espera-se que modelos LLM poderosos sigam o mesmo caminho.
- No fim, a escala da infraestrutura será o diferencial.
A DeepSeek é um projeto paralelo de um fundo hedge, e há a possibilidade de obter grandes lucros vendendo ações da NVIDIA a descoberto e divulgando tudo.
A razão para tornar a DeepSeek open source é que desenvolvedores querem mostrar algo incrível que criaram.
- Muitas pessoas tentam encontrar uma motivação financeira, mas quem realmente fez isso são engenheiros, não empresários. A DeepSeek é de fato um projeto muito incrível, e eles quiseram mostrar essa criação impressionante.

A necessidade de tornar o DeepSeek open source

Leituras relacionadas

1 comentários

Opinião do Hacker News