3 pontos por GN⁺ 2024-10-13 | 1 comentários | Compartilhar no WhatsApp

Turin da AMD: lançamento do EPYC de 5ª geração

  • CPU de servidor de 5 GHz
    • Introdução ao EPYC 9575F, o novo CPU de servidor da AMD, em um artigo escrito com base em experiência prática direta, ao contrário do Granite Rapids anterior.
    • Como as diferenças entre as versões móveis e desktop dos núcleos Zen 5 já foram abordadas, este artigo foca nas mudanças do subsistema de memória do Turin.

Largura de banda de memória

  • O 9575F registrou cerca de 52GB/s de largura de banda de leitura de memória, 48GB/s de escrita e 95GB/s de leitura-modificação-escrita.
  • Observando o uso de largura de banda de memória em um único CCD, um único núcleo pode usar menos da metade da largura de banda total de leitura de memória do CCD, cerca de 55% da largura de banda de escrita e mais de 2/3 da largura de banda de leitura-modificação-escrita.
  • O 9575F tem largura de banda para o CCD consideravelmente maior do que as peças Zen 5 para desktop, porque fornece 2 links GMI para o die de IO por meio do GMI3-W.
  • Turin suporta até DDR5-6400MT/s, com suporte por canal por DIMM apenas em sistemas específicos. A maioria dos sistemas suporta 6000MT/s, e ao configurar 2 DIMMs por canal isso cai para 4400 MT/s.

Latência de memória

  • A latência de memória sem carga do Turin é semelhante à do Genoa.
  • Ao medir a latência de memória sob carga, houve aumento de cerca de 39 nanossegundos em relação ao estado sem carga quando um único CCD estava sob carga, e de cerca de 31 nanossegundos quando o sistema inteiro estava sob carga.
  • A latência dentro do CCD é de cerca de 45ns, entre CCDs é de cerca de 150ns e entre sockets é de cerca de 260ns, mostrando aumento de latência em comparação com o Genoa.

Velocidade de clock

  • Todos os 64 núcleos do 9575F podem atingir até 5GHz em testes de thread única, e em testes de largura de banda de memória 8 núcleos operam a 5GHz.
  • No Cinebench 2024, com 128 threads em execução, o 9575F mantém cerca de 4,3GHz, enquanto em workloads de servidor web/transações TLS registra cerca de 4,9GHz.

Conclusão

  • O Turin da AMD é uma atualização geracional previsível, oferecendo SKUs com alta contagem de núcleos e SKUs de alta frequência com menos núcleos para atender às necessidades de vários mercados.
  • Turin está mais próximo de uma evolução de Milan para Genoa do que de uma mudança revolucionária de Naples para Rome, incluindo aumento de largura de banda de memória, aumento de contagem de núcleos e atualização dos núcleos.
  • Esta geração oferece muito valor em um ecossistema competitivo e deve interessar muita gente.

Resumo do GN⁺

  • O Turin da AMD representa um avanço importante no mercado de CPUs para servidores, com melhorias especialmente notáveis em largura de banda de memória e desempenho dos núcleos.
  • Este artigo é útil para quem quer entender a tecnologia mais recente da AMD e pode ajudar engenheiros interessados em otimização de desempenho de servidores.
  • Um produto com recursos semelhantes ao Turin é a série Xeon da Intel, e a comparação com a AMD permite entender os pontos fortes e fracos de cada produto.

1 comentários

 
GN⁺ 2024-10-13
Comentários do Hacker News
  • O AMD EPYC 9175F é um produto incomum com 16 núcleos e 512MB de cache L3. Parece ser voltado a clientes que querem minimizar custos de licenciamento "por núcleo". Fico me perguntando se a Oracle ainda usa esse modelo de licença

    • Para fins específicos, como HFT, também pode dar para colocar o algoritmo inteiro no L3 e buscar a menor latência possível
    • Mas provavelmente está mais relacionado a questões de licenciamento de software
  • O Phoronix publicou uma análise comparando o Turin Dense de 196 núcleos com o AmpereOne de 192 núcleos

    • O MSRP da Ampere é US$ 5,5 mil, e o do EPYC é US$ 15 mil
    • O Turin 196 entrega 1,6x mais desempenho
    • A Ampere é 1,2x mais eficiente em consumo de energia
    • Em termos reais de $/desempenho, o Ampere de 192 núcleos é 1,7x melhor que o Turin Dense de 196 núcleos
  • Por US$ 5,5 mil, é possível comprar um CPU AmpereOne de 192 núcleos (274W) ou um CPU Turin Dense de 48 núcleos (300W)

    • A Ampere planeja lançar no ano que vem um produto com 256 núcleos, 3nm e 12 canais de memória, que pode ser um competidor melhor em desempenho contra o Turin Dense e o Sierra Forest
    • No momento, a proposta de valor deles está em $/desempenho
  • Tenho muito interesse no desempenho do chip de servidor da Qualcomm baseado em Nuvia

    • Se as melhorias dos núcleos cliente da ARM servirem de indicação, fico muito curioso para ver como chips próprios como AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace e Alibaba Yitian vão competir com núcleos Neoverse melhores
    • Estou animado com a disputa entre Nuvia vs ARM vs AmpereOne
  • Este pode muito bem ser a era de ouro dos CPUs para servidor neste momento

    • Há 7 anos, só existia o Xeon da Intel
    • Agora há várias opções
  • Estou ansioso para ver a Hetzner disponibilizar servidores bare metal com AMD Turin

    • A geração anterior já oferecia um excelente custo-benefício, mas desta vez parece ter dado um passo além
  • Há 20 anos, CPUs tinham só 1 ou 2 núcleos, e era sorte ter 4 núcleos em um servidor dual-socket

    • Agora é possível ter quase 400 núcleos em um único servidor
    • Os núcleos ARM podem ser mais numerosos, mas por enquanto não têm um desempenho tão bom quanto estes
  • Para quem não gosta da mudança para o Substack, existe um site alternativo

  • Estou rodando um Dell PowerEdge de 12 anos com dual Xeon

    • Estou esperando os servidores Epyc de primeira geração aparecerem baratos no eBay
  • ChipsAndCheese é uma das novas publicações técnicas e tem um conhecimento excepcional, especialmente em benchmarks aprofundados

    • Com o desaparecimento de sites técnicos antigos como Anandtech, TechReport e HardCOP, é bom ver uma nova publicação conseguindo manter esse estilo
  • Lançado em um momento perfeito para o Factorio 2.0

  • Quero muito ver o 9965 em ação

    • Essas peças são impressionantes
    • Pretendo comprar uma máquina desta geração
  • No vídeo, há um gráfico de TDP em 1:11

    • Funciona muito quente, na faixa de 125-500W