10 pontos por GN⁺ 2024-07-04 | 1 comentários | Compartilhar no WhatsApp
  • A bolha da IA está chegando a um ponto de inflexão. Será importante saber lidar com as mudanças daqui para frente
  • Em setembro de 2023, publiquei um texto chamado "A pergunta de US$ 200B da IA". O objetivo desse texto era fazer a pergunta: "Onde está a receita?"
    • Na época, constatei que havia uma grande lacuna entre as expectativas de receita embutidas na construção da infraestrutura de IA e o crescimento real da receita no ecossistema de IA. Descrevi isso como "um buraco de US$ 125 bilhões por ano que precisa ser preenchido para justificar o nível atual de CapEx"
    • Recentemente, a Nvidia se tornou a empresa mais valiosa do mundo. Antes disso, muitas pessoas me procuraram para perguntar sobre o resultado da minha análise. Queriam saber se o problema de US$ 200 bilhões da IA havia sido resolvido ou se tinha piorado
  • Se refizermos essa análise hoje, chegaremos ao seguinte resultado:
    • O problema de US$ 200B (₩ 260 trilhões) da IA agora virou um problema de US$ 600B (₩ 830 trilhões)
    • Podemos pegar a projeção de receita anual da Nvidia e multiplicá-la por 2 para refletir o custo total dos data centers de IA (GPU representa metade do custo total de propriedade; a outra metade inclui energia, edifícios, geradores de backup etc.)
    • Depois, multiplicamos por 2 novamente para refletir a margem bruta total de 50% dos usuários finais de GPU (por exemplo, startups ou empresas que compram computação de IA na Azure, AWS ou GCP também precisam ter lucro)

O que mudou

  1. Fim da escassez de oferta

    • No fim de 2023, a escassez de oferta de GPUs atingiu o pico
    • Agora é fácil conseguir GPUs
  2. Aumento do estoque de GPUs

    • Metade da receita de data center da Nvidia vem dos grandes provedores de nuvem
    • A Microsoft responde por cerca de 22% da receita do Q4 da Nvidia
    • O CapEx dos hyperscalers chegou a níveis históricos
  3. Participação da OpenAI na receita

    • A receita da OpenAI aumentou de US$ 1,6 bilhão no fim de 2023 para US$ 3,4 bilhões agora
    • Fora o ChatGPT, não há muitos produtos de IA que os consumidores realmente usem
  4. O buraco de US$ 125 bilhões virou um buraco de US$ 500 bilhões

    • Supõe-se que Google, Microsoft, Apple e Meta gerem cada uma US$ 10 bilhões por ano em nova receita relacionada à IA
    • Supõe-se que Oracle, ByteDance, Alibaba, Tencent, X e Tesla gerem cada uma US$ 5 bilhões em nova receita de IA
    • Mesmo que essas suposições estejam corretas, o buraco de US$ 125 bilhões agora se ampliou para US$ 500 bilhões
  5. A chegada da B100

    • A Nvidia anunciou o chip B100
    • A B100 oferece desempenho 2,5 vezes melhor que o H100, com aumento de custo de apenas 25%
    • Espera-se que a demanda pela B100 dispare

Principais contrapontos (diferenças em relação a construções passadas de infraestrutura)

  1. Falta de poder de precificação

    • Ao contrário da infraestrutura física, os data centers de GPU têm menos poder de precificação
    • A computação com GPU está se tornando cada vez mais uma commodity, cobrada por hora
  2. Queima de investimento

    • Assim como na infraestrutura física, como as ferrovias, ondas de investimento especulativo têm alta taxa de destruição de capital
    • Segundo os motores que movem o mercado, muitas pessoas focadas em ferrovias perderam muito dinheiro durante ondas tecnológicas especulativas
  3. Depreciação

    • Os semicondutores melhoram de desempenho com o tempo
    • A Nvidia continuará produzindo chips melhores de próxima geração
    • Isso levará a uma depreciação mais rápida dos chips da geração anterior
  4. Vencedores e perdedores

    • A IA tem grande chance de ser a próxima onda tecnológica transformadora
    • A queda no preço da computação com GPU é positiva para a inovação e para as startups no longo prazo

Conclusão

  • A IA vai criar um valor econômico enorme
  • A Nvidia merece grande reconhecimento pelo papel que desempenhou para tornar essa transição possível
  • O frenesi especulativo faz parte da tecnologia, e não há motivo para temê-lo
  • Não devemos cair na ilusão de que a AGI chegará em breve
  • O caminho à frente será longo e cheio de altos e baixos, mas quase certamente valerá a pena

A opinião do GN⁺

  • A IA vai criar um valor econômico enorme. Fundadores de empresas focadas em entregar valor ao usuário final serão amplamente recompensados
  • O frenesi especulativo faz parte da tecnologia, então não há motivo para temê-lo. Quem atravessar este momento com serenidade terá a oportunidade de construir empresas muito importantes
  • Mas é preciso tomar cuidado para não acreditar no delírio que se espalhou do Vale do Silício para todo o país e, na prática, para o mundo inteiro
    • Esse "delírio" diz que todos nós vamos enriquecer rapidamente, porque a AGI chegará amanhã e todos devemos estocar GPUs, o único recurso com valor real
    • Não devemos cair na ilusão de que a AGI chegará em breve
  • Na prática, o caminho à frente será longo. Haverá altos e baixos, mas quase certamente valerá a pena

1 comentários

 
GN⁺ 2024-07-04
Comentários do Hacker News
  • Segundo Jensen, para treinar um modelo do porte do GPT-4 são necessárias 8.000 GPUs H100 por 90 dias

    • A Meta possui 350.000 GPUs, então poderia treinar 200 modelos do porte do GPT-4 por ano
    • Isso pode levar a margem de lucro real das empresas focadas em IA para perto de zero
    • É ruim para investidores, mas bom para desenvolvedores
    • O fator mais importante para a qualidade da saída do modelo são os dados proprietários usados no treinamento
  • As grandes empresas de tecnologia estão investindo pesadamente em hardware

    • Isso é parecido com investir em Sun Microsystems e Netscape no fim dos anos 90
    • Sabíamos que a internet mudaria o mundo, mas não sabíamos como o dinheiro iria circular
  • A receita da IA não vem de forma direta, mas da redução de custos e do aumento de produtividade

    • A IA ajuda em todos os aspectos de uma startup
  • Há foco excessivo em ganhos de produtividade

    • Existe mais potencial no valor de entretenimento
    • No momento, apps meio improvisados estão ganhando dinheiro
    • Ainda não sabemos qual será o verdadeiro produto de sucesso
  • É provável que o investimento em IA dê certo

    • Pelos casos da internet e do mobile, muitas empresas bem-sucedidas surgiram depois que o hype passou
  • Há previsões de que a IA vai criar grande valor econômico

    • Mas isso é uma aposta forte sem evidências
    • Existe a crença de que a IA vai mudar tudo
  • O avanço da IA será longo e difícil

    • Mas valerá a pena
    • O caso FTX pode ter servido de lição
  • LLMs são excelentes em tarefas básicas, mas têm limitações em tarefas complexas

    • As pessoas tendem a culpar os outros
    • Elas serão mais usadas em entretenimento e aplicações inesperadas do que em funções voltadas ao atendimento ao cliente
  • A suposição de que todas as GPUs de datacenter serão usadas para IA está errada

    • O modelo de negócios de IA não se resume a cobrar pelo uso de API
    • A IA já desempenha um papel importante nos negócios de busca e publicidade do Google
  • Considerando a população e o PIB dos países da OCDE, o investimento em IA pode aumentar muito a produtividade

    • Mas é duvidoso que o investimento atual possa ser recuperado rapidamente