- O autor trabalhou por 10 anos como analista de investimentos em diversos hedge funds e tem uma perspectiva única sobre a evolução da tecnologia de IA e a precificação das ações no mercado.
- Nos últimos anos, vem trabalhando como desenvolvedor e conduzindo vários projetos open source relacionados a modelos e serviços de IA.
# Nvidia : The Bull Case
Contexto da alta das ações da Nvidia
- Crescimento da IA e do deep learning: o deep learning e a IA são vistos como as tecnologias mais revolucionárias desde a internet, e a Nvidia garantiu uma posição quase monopolista no setor de GPUs, impulsionando grandes investimentos e gastos com infraestrutura por parte das principais empresas.
- Margens elevadas: registra margens de lucro superiores a 90% em produtos avançados para data centers.
- Mercado escalável: com o crescimento da IA, nova demanda está sendo criada em diversas aplicações, como data centers, robótica e substituição de trabalho humano.
- "Lei de escala": o desempenho dos modelos melhora continuamente com a expansão dos dados e dos recursos computacionais, e a Nvidia está aproveitando isso ao máximo.
Posição atual da Nvidia e vantagem competitiva
- Plataforma CUDA: o ecossistema de software da Nvidia, que se tornou o padrão de fato para programação em GPU.
- Aquisição da Mellanox: oferece vantagem sobre concorrentes em data centers com tecnologia de interconexão de alto desempenho entre GPUs.
- Software proprietário e qualidade dos drivers: drivers e estabilidade de software superiores aos da AMD.
- Estratégia para manter a liderança: reinveste seus altos lucros em pesquisa e desenvolvimento (P&D) para sustentar continuamente sua vantagem tecnológica.
# Principais ameaças à Nvidia
Concorrência em hardware
- Cerebras: apresenta uma nova abordagem com chips de IA em escala de wafer, contornando os problemas de processamento paralelo e interconexão das GPUs da Nvidia.
- Groq: maximiza o desempenho de inferência em IA com tecnologia baseada em "computação determinística".
- Desenvolvimento de chips próprios pelos principais clientes:
- Amazon: adoção de chips próprios como Trainium2 e Inferentia2.
- Google: desenvolvimento interno do chip TPU de 6ª geração.
- Microsoft e OpenAI: anunciaram planos para desenvolver seus próprios chips de IA.
- Apple: possibilidade de aplicar aos chips de IA a tecnologia acumulada em chips voltados ao consumidor.
Concorrência em software
- Frameworks de abstração de alto nível:
- plataformas como MLX, Triton e JAX reduzem a importância do CUDA e ampliam sua substituibilidade.
- Tecnologia de conversão de código: estão sendo desenvolvidas técnicas para usar LLMs na conversão de código CUDA para outros hardwares.
- Melhorias nos drivers da AMD: desenvolvedores open source estão trabalhando em novos drivers para otimizar o desempenho das GPUs da AMD.
Inovações de eficiência em modelos de IA
- Surgimento da DeepSeek:
- a DeepSeek alcançou desempenho competitivo em relação a modelos rivais com custo equivalente a 1/45 do da Nvidia, usando treinamento em precisão mista FP8 e tecnologias de inferência de alta eficiência.
- usa a arquitetura Mixture-of-Experts (MOE) para implementar modelos de grande escala com eficiência de memória.
- tecnologias como "Multi-head Latent Attention" reduzem drasticamente o uso de VRAM.
- o custo de chamadas de API é 95% mais barato do que em OpenAI e Anthropic.
Mudanças na estrutura da indústria
- Papel da TSMC: como a Nvidia não fabrica seus próprios chips, a TSMC pode produzir chips de outros concorrentes no mesmo processo.
- Esforços de internalização por parte de todos os clientes: para reduzir a dependência dos produtos de alta margem da Nvidia, os principais clientes estão investindo no design de chips próprios.
Perspectivas de mercado e desafios da Nvidia
- O preço atual das ações da Nvidia depende de um cenário de crescimento extremamente otimista, que pressupõe 20 vezes a receita de 2025 e margens de lucro superiores a 75%.
- Há possibilidade de desaceleração do crescimento e queda nas margens devido a inovações de eficiência e ao acirramento da concorrência em hardware e software.
- Mesmo que a Nvidia continue mantendo vantagem no setor de IA, os desafios contínuos dos concorrentes podem afetar sua participação de mercado e seu crescimento de longo prazo.
# Conclusão
- A Nvidia ocupa hoje uma posição incomparável como líder da inovação em IA, mas pode ter dificuldade para sustentar sua atual avaliação elevada devido a ameaças competitivas em múltiplas frentes e às rápidas mudanças na indústria.
- Os investidores devem avaliar de forma positiva a vantagem tecnológica da Nvidia e o potencial de crescimento do mercado de IA, mas também precisam observar com atenção os riscos trazidos pela inovação dos concorrentes e pelas mudanças na estrutura do mercado.
1 comentários
Comentários do Hacker News
A explicação da DeepSeek lembra a experiência com redes nos anos 80 e 90. Na época, vídeo sob demanda era um grande mercado, e o potencial de algoritmos avançados de codificação de vídeo foi ignorado. A viabilidade do vídeo na internet veio não de uma internet mais rápida, mas de algoritmos mais inteligentes.
Se a DeepSeek consegue fazer mais com menos recursos, o Paradoxo de Jevons entrará em ação. As vendas de GPUs aumentarão com a ideia de que empresas menores também podem competir. A DeepSeek afirma conseguir treinar modelos competitivos com cerca de 200 funcionários e com um custo 20 vezes menor que o das grandes empresas.
Destaca-se a desvantagem de ser o primeiro a se mover no desenvolvimento de modelos de IA. Se um modelo puder ser copiado por 5% do custo, há duas decisões racionais:
Empresas como a OpenAI precisam se transformar em plataformas que desfrutem de efeitos de rede diretos.
A maior parte da computação em IA está se concentrando em inferência. O R1 (680B) pode ser executado de forma distribuída em 3 computadores de consumo. A vantagem da NVIDIA é conectar milhares de GPUs com eficiência, mas isso será importante apenas para uma pequena parte da computação em IA.
Várias das vantagens da NVIDIA estão sendo atacadas. Porém, como os concorrentes estão atacando apenas vantagens específicas, a NVIDIA provavelmente continuará sendo a única empresa com todas elas.
O verdadeiro teste da IA para robôs humanoides é dobrar roupa. Com a tecnologia atual, isso ainda é um problema difícil. Fico curioso se houve avanços recentes em IA para robôs.
A eficiência de implantar um modelo MoE de 687B em hardware comum está sendo superestimada. No hardware da Apple isso é impossível, e em computadores desktop isso mal é viável. Por causa de problemas de largura de banda do PCIe, tarefas de programação levam 12 minutos.
Pode haver uma estratégia ilegal: esperar a recuperação do preço da NVDA e lucrar criando um concorrente da OpenAI.
Poucas pessoas estão avaliando corretamente o efeito da DeepSeek. Se algo é 10x mais eficiente, isso não leva ao uso de 1/10 dos recursos, mas sim a usar 10 vezes mais. Produtos tecnológicos sempre caminharam nessa direção.
Mesmo para quem não tem interesse em estratégias de venda a descoberto no mercado de ações, os artigos da DeepSeek v3 e R1 trazem muito conteúdo técnico excelente, resumindo com clareza ideias interessantes.