3 pontos por GN⁺ 2025-01-28 | 1 comentários | Compartilhar no WhatsApp
  • O autor trabalhou por 10 anos como analista de investimentos em diversos hedge funds e tem uma perspectiva única sobre a evolução da tecnologia de IA e a precificação das ações no mercado.
  • Nos últimos anos, vem trabalhando como desenvolvedor e conduzindo vários projetos open source relacionados a modelos e serviços de IA.

# Nvidia : The Bull Case

Contexto da alta das ações da Nvidia

  • Crescimento da IA e do deep learning: o deep learning e a IA são vistos como as tecnologias mais revolucionárias desde a internet, e a Nvidia garantiu uma posição quase monopolista no setor de GPUs, impulsionando grandes investimentos e gastos com infraestrutura por parte das principais empresas.
  • Margens elevadas: registra margens de lucro superiores a 90% em produtos avançados para data centers.
  • Mercado escalável: com o crescimento da IA, nova demanda está sendo criada em diversas aplicações, como data centers, robótica e substituição de trabalho humano.
  • "Lei de escala": o desempenho dos modelos melhora continuamente com a expansão dos dados e dos recursos computacionais, e a Nvidia está aproveitando isso ao máximo.

Posição atual da Nvidia e vantagem competitiva

  • Plataforma CUDA: o ecossistema de software da Nvidia, que se tornou o padrão de fato para programação em GPU.
  • Aquisição da Mellanox: oferece vantagem sobre concorrentes em data centers com tecnologia de interconexão de alto desempenho entre GPUs.
  • Software proprietário e qualidade dos drivers: drivers e estabilidade de software superiores aos da AMD.
  • Estratégia para manter a liderança: reinveste seus altos lucros em pesquisa e desenvolvimento (P&D) para sustentar continuamente sua vantagem tecnológica.

# Principais ameaças à Nvidia

Concorrência em hardware

  • Cerebras: apresenta uma nova abordagem com chips de IA em escala de wafer, contornando os problemas de processamento paralelo e interconexão das GPUs da Nvidia.
  • Groq: maximiza o desempenho de inferência em IA com tecnologia baseada em "computação determinística".
  • Desenvolvimento de chips próprios pelos principais clientes:
    • Amazon: adoção de chips próprios como Trainium2 e Inferentia2.
    • Google: desenvolvimento interno do chip TPU de 6ª geração.
    • Microsoft e OpenAI: anunciaram planos para desenvolver seus próprios chips de IA.
    • Apple: possibilidade de aplicar aos chips de IA a tecnologia acumulada em chips voltados ao consumidor.

Concorrência em software

  • Frameworks de abstração de alto nível:
    • plataformas como MLX, Triton e JAX reduzem a importância do CUDA e ampliam sua substituibilidade.
  • Tecnologia de conversão de código: estão sendo desenvolvidas técnicas para usar LLMs na conversão de código CUDA para outros hardwares.
  • Melhorias nos drivers da AMD: desenvolvedores open source estão trabalhando em novos drivers para otimizar o desempenho das GPUs da AMD.

Inovações de eficiência em modelos de IA

  • Surgimento da DeepSeek:
    • a DeepSeek alcançou desempenho competitivo em relação a modelos rivais com custo equivalente a 1/45 do da Nvidia, usando treinamento em precisão mista FP8 e tecnologias de inferência de alta eficiência.
    • usa a arquitetura Mixture-of-Experts (MOE) para implementar modelos de grande escala com eficiência de memória.
    • tecnologias como "Multi-head Latent Attention" reduzem drasticamente o uso de VRAM.
    • o custo de chamadas de API é 95% mais barato do que em OpenAI e Anthropic.

Mudanças na estrutura da indústria

  • Papel da TSMC: como a Nvidia não fabrica seus próprios chips, a TSMC pode produzir chips de outros concorrentes no mesmo processo.
  • Esforços de internalização por parte de todos os clientes: para reduzir a dependência dos produtos de alta margem da Nvidia, os principais clientes estão investindo no design de chips próprios.

Perspectivas de mercado e desafios da Nvidia

  • O preço atual das ações da Nvidia depende de um cenário de crescimento extremamente otimista, que pressupõe 20 vezes a receita de 2025 e margens de lucro superiores a 75%.
  • Há possibilidade de desaceleração do crescimento e queda nas margens devido a inovações de eficiência e ao acirramento da concorrência em hardware e software.
  • Mesmo que a Nvidia continue mantendo vantagem no setor de IA, os desafios contínuos dos concorrentes podem afetar sua participação de mercado e seu crescimento de longo prazo.

# Conclusão

  • A Nvidia ocupa hoje uma posição incomparável como líder da inovação em IA, mas pode ter dificuldade para sustentar sua atual avaliação elevada devido a ameaças competitivas em múltiplas frentes e às rápidas mudanças na indústria.
  • Os investidores devem avaliar de forma positiva a vantagem tecnológica da Nvidia e o potencial de crescimento do mercado de IA, mas também precisam observar com atenção os riscos trazidos pela inovação dos concorrentes e pelas mudanças na estrutura do mercado.

1 comentários

 
GN⁺ 2025-01-28
Comentários do Hacker News
  • A explicação da DeepSeek lembra a experiência com redes nos anos 80 e 90. Na época, vídeo sob demanda era um grande mercado, e o potencial de algoritmos avançados de codificação de vídeo foi ignorado. A viabilidade do vídeo na internet veio não de uma internet mais rápida, mas de algoritmos mais inteligentes.

    • No caso da IA, as GPUs continuam ficando mais rápidas, mas uma melhoria de 10x no desempenho do silício levará muito tempo. A DeepSeek sugere a possibilidade de descobrir novos algoritmos.
  • Se a DeepSeek consegue fazer mais com menos recursos, o Paradoxo de Jevons entrará em ação. As vendas de GPUs aumentarão com a ideia de que empresas menores também podem competir. A DeepSeek afirma conseguir treinar modelos competitivos com cerca de 200 funcionários e com um custo 20 vezes menor que o das grandes empresas.

  • Destaca-se a desvantagem de ser o primeiro a se mover no desenvolvimento de modelos de IA. Se um modelo puder ser copiado por 5% do custo, há duas decisões racionais:

    • focar na eficiência de custos para reduzir a vantagem de quem vem em segundo
    • construir barreiras competitivas por meio de economias de escala, efeitos de rede e captura regulatória
  • Empresas como a OpenAI precisam se transformar em plataformas que desfrutem de efeitos de rede diretos.

  • A maior parte da computação em IA está se concentrando em inferência. O R1 (680B) pode ser executado de forma distribuída em 3 computadores de consumo. A vantagem da NVIDIA é conectar milhares de GPUs com eficiência, mas isso será importante apenas para uma pequena parte da computação em IA.

  • Várias das vantagens da NVIDIA estão sendo atacadas. Porém, como os concorrentes estão atacando apenas vantagens específicas, a NVIDIA provavelmente continuará sendo a única empresa com todas elas.

  • O verdadeiro teste da IA para robôs humanoides é dobrar roupa. Com a tecnologia atual, isso ainda é um problema difícil. Fico curioso se houve avanços recentes em IA para robôs.

  • A eficiência de implantar um modelo MoE de 687B em hardware comum está sendo superestimada. No hardware da Apple isso é impossível, e em computadores desktop isso mal é viável. Por causa de problemas de largura de banda do PCIe, tarefas de programação levam 12 minutos.

  • Pode haver uma estratégia ilegal: esperar a recuperação do preço da NVDA e lucrar criando um concorrente da OpenAI.

  • Poucas pessoas estão avaliando corretamente o efeito da DeepSeek. Se algo é 10x mais eficiente, isso não leva ao uso de 1/10 dos recursos, mas sim a usar 10 vezes mais. Produtos tecnológicos sempre caminharam nessa direção.

  • Mesmo para quem não tem interesse em estratégias de venda a descoberto no mercado de ações, os artigos da DeepSeek v3 e R1 trazem muito conteúdo técnico excelente, resumindo com clareza ideias interessantes.