2 pontos por xguru 2022-03-23 | 1 comentários | Compartilhar no WhatsApp
  • Na GTC 2022, foi anunciada a arquitetura Hopper™ de próxima geração e a H100 baseada nela.
    → O nome é uma homenagem a Grace Hopper. Dá continuidade à arquitetura Ampere
  • Seis inovações tecnológicas para acelerar IA em larga escala e HPC
    • Integra 80 bilhões de transistores no processo de 4 nanômetros da TSMC. Suporte a PCIe Gen5 e primeira GPU a usar memória HBM3 (largura de banda de memória de 3 TB/s)
    • Novo mecanismo Transformer com aceleração 6 vezes maior que a geração anterior
    • Multi-Instance GPU (MIG) de segurança de 2ª geração — permite particionar uma única GPU em partes menores para executar cargas de trabalho isoladas. Na arquitetura Hopper, o MIG foi aprimorado em 7 vezes em relação à geração anterior
    • Primeiro acelerador de Confidential Computing para proteger modelos de IA em processamento e dados de clientes
    • NVIDIA NVLink de 4ª geração — conecta até 256 GPUs H100 com largura de banda 9 vezes maior (em comparação com o NVIDIA HDR Quantum InfiniBand existente)
    • Novas instruções DPX para acelerar a "programação dinâmica" usada em algoritmos, otimização de rotas e genômica. Até 7 vezes mais rápido que a GPU da geração anterior e 40 vezes mais rápido que a CPU.
  • Suporta o modelo de linguagem Megatron 530B com throughput até 30 vezes maior que a geração anterior