CEO da Nvidia, Jensen Huang, anuncia novo chip de IA: 'É preciso uma GPU maior'
- A Nvidia anunciou na segunda-feira uma nova geração de chips de inteligência artificial (IA) e software para executar modelos de IA.
- O novo processador gráfico de IA se chama 'Blackwell' e deve começar a ser enviado no fim deste ano.
- O anúncio acontece em um momento importante para empresas e desenvolvedores de software que ainda correm para conseguir chips semelhantes ao H100 da geração atual.
Blackwell, sucessor do Hopper
- A Nvidia atualiza sua arquitetura de GPU a cada dois anos, alcançando grandes saltos de desempenho.
- O GB200, processador baseado em Blackwell, oferece 20 petaflops de desempenho em IA, em comparação com os 4 petaflops do H100, permitindo que empresas de IA treinem modelos maiores e mais complexos.
- O chip inclui um 'Transformer Engine' feito especialmente para executar IA baseada em transformers e combina dois dies fabricados pela TSMC em um único chip grande.
Microsserviços de inferência da Nvidia
- A Nvidia adicionou à assinatura de software Nvidia Enterprise um novo produto chamado 'NIM' (Nvidia Inference Microservice).
- O NIM facilita o processo de inferência para executar software de IA usando GPUs Nvidia já existentes, permitindo que as empresas continuem usando os milhões de GPUs Nvidia que já possuem.
- Essa estratégia incentiva clientes que compram servidores baseados em Nvidia a aderirem ao Nvidia Enterprise, que cobra uma licença anual de US$ 4.500 por GPU.
Opinião do GN⁺
- O anúncio do novo chip de IA 'Blackwell' da Nvidia e do software relacionado 'NIM' simboliza o avanço tecnológico no campo da IA e destaca a importância das plataformas de hardware e software para o treinamento e a inferência de modelos de IA.
- O ganho de desempenho do chip Blackwell oferece aos pesquisadores de IA a oportunidade de experimentar modelos maiores e mais complexos, o que pode desempenhar um papel importante no avanço da IA.
- No entanto, o alto preço de chips de IA de alto desempenho pode se tornar uma barreira de entrada para algumas empresas ou instituições de pesquisa, o que pode estimular discussões sobre a democratização da tecnologia.
- Outras empresas que competem com a Nvidia também estão desenvolvendo produtos com capacidades semelhantes, como o Radeon Instinct da AMD ou o TPU do Google, oferecendo alternativas no mercado de hardware para IA.
- Entre os fatores a considerar na adoção de tecnologia de IA estão custo, desempenho, compatibilidade e suporte técnico, e a nova escolha tecnológica da Nvidia pode trazer grandes vantagens para empresas que atendam a esses critérios.
2 comentários
Este é um resumo do conteúdo em vídeo da CNET feito com o corely.ai (https://www.youtube.com/watch?v=bMIRhOXAjYk)
Comentários do Hacker News
Foi observado na conferência que a Nvidia está avançando no sentido de ampliar a stack.
Há o reconhecimento de que a Nvidia está se transformando em uma provedora de plataforma.
Há curiosidade sobre se FP4 é ponto flutuante de 4 bits.
A Nvidia adquiriu a Bright Cluster Manager há alguns anos.
Pergunta-se se "empresa de plataforma" neste caso significa múltiplos chips.
Alega-se uma redução de 25 vezes no consumo de energia, o que é difícil de entender.
Houve menção à produção em massa na casa de dezenas de petaflops.
A receita de data center da Nvidia atingiu um recorde de US$ 18,4 bilhões no 4º trimestre de 2023.
O fato de o FP8 ser 2,5 vezes melhor que Hopper é um pouco decepcionante depois de tanto tempo.
Foi fornecido um link com mais informações sobre os detalhes técnicos.