- Na GTC 2022, foi anunciada a arquitetura Hopper™ de próxima geração e a H100 baseada nela.
→ O nome é uma homenagem a Grace Hopper. Dá continuidade à arquitetura Ampere
- Seis inovações tecnológicas para acelerar IA em larga escala e HPC
- Integra 80 bilhões de transistores no processo de 4 nanômetros da TSMC. Suporte a PCIe Gen5 e primeira GPU a usar memória HBM3 (largura de banda de memória de 3 TB/s)
- Novo mecanismo Transformer com aceleração 6 vezes maior que a geração anterior
- Multi-Instance GPU (MIG) de segurança de 2ª geração — permite particionar uma única GPU em partes menores para executar cargas de trabalho isoladas. Na arquitetura Hopper, o MIG foi aprimorado em 7 vezes em relação à geração anterior
- Primeiro acelerador de Confidential Computing para proteger modelos de IA em processamento e dados de clientes
- NVIDIA NVLink de 4ª geração — conecta até 256 GPUs H100 com largura de banda 9 vezes maior (em comparação com o NVIDIA HDR Quantum InfiniBand existente)
- Novas instruções DPX para acelerar a "programação dinâmica" usada em algoritmos, otimização de rotas e genômica. Até 7 vezes mais rápido que a GPU da geração anterior e 40 vezes mais rápido que a CPU.
- Suporta o modelo de linguagem Megatron 530B com throughput até 30 vezes maior que a geração anterior
1 comentários
MS e Nvidia anunciam o MT-NLG 530B, o maior modelo de linguagem do mundo