A necessidade de tornar o DeepSeek open source
(getlago.com)-
Motivos para o DeepSeek ser open source
- A DeepSeek é um laboratório chinês de pesquisa em IA que desenvolveu o R1, um modelo de raciocínio open source.
- Desenvolveu um modelo com desempenho semelhante ao da OpenAI a um custo baixo, graças a métodos de treinamento inovadores.
- Por ser uma empresa chinesa, precisava adotar o open source para conquistar confiança no mercado ocidental.
- Open source não é apenas uma ação técnica, mas também uma ação cultural.
-
Comoditização dos modelos
- Os modelos de LLM estão se tornando cada vez mais comoditizados, e a diferença de desempenho não é grande.
- A OpenAI ainda é líder, mas modelos open source como o DeepSeek R1 oferecem custos mais baixos.
- Em infraestrutura, o open source tende a vencer no longo prazo.
-
Vantagens do open source em infraestrutura
- Open source é mais barato e permite personalização, mas exige manutenção.
- Infraestrutura sempre precisa de customização, e quanto mais técnico for o produto, mais os engenheiros tendem a preferir open source.
- O motivo do sucesso de empresas open source como a Lago é que engenheiros podem gerenciar diretamente sistemas de cobrança complexos.
-
O futuro da OpenAI
- A OpenAI ainda ocupa uma posição importante no mercado e segue liderando em LLMs e modelos de raciocínio.
- Há quem diga que modelos como o DeepSeek R1 podem substituir a OpenAI, mas sem as inovações da OpenAI esses modelos talvez nem existissem.
- O R1 pode incentivar grandes empresas já estabelecidas a buscar métodos mais eficientes.
1 comentários
Opinião do Hacker News
Entre as grandes startups chinesas de modelos, apenas a DeepSeek escolheu o código aberto sem priorizar a comercialização. Isso acabou gerando divulgação orgânica de usuários dentro da comunidade.
APIs chinesas de IA provavelmente serão recebidas com ceticismo no Ocidente. Há razões historicamente justificáveis para isso.
Segundo um memorando interno do Google, o código aberto está evoluindo mais rápido e com mais eficiência do que equipes fechadas.
Argumenta-se que uma empresa com "Open" no nome deveria compartilhar as partes importantes, mesmo que não compartilhe tudo.
Assim como o Linux teve sucesso no longo prazo, espera-se que modelos LLM poderosos sigam o mesmo caminho.
A DeepSeek é um projeto paralelo de um fundo hedge, e há a possibilidade de obter grandes lucros vendendo ações da NVIDIA a descoberto e divulgando tudo.
A razão para tornar a DeepSeek open source é que desenvolvedores querem mostrar algo incrível que criaram.