Turin da AMD: lançamento do EPYC de 5ª geração
- CPU de servidor de 5 GHz
- Introdução ao EPYC 9575F, o novo CPU de servidor da AMD, em um artigo escrito com base em experiência prática direta, ao contrário do Granite Rapids anterior.
- Como as diferenças entre as versões móveis e desktop dos núcleos Zen 5 já foram abordadas, este artigo foca nas mudanças do subsistema de memória do Turin.
Largura de banda de memória
- O 9575F registrou cerca de 52GB/s de largura de banda de leitura de memória, 48GB/s de escrita e 95GB/s de leitura-modificação-escrita.
- Observando o uso de largura de banda de memória em um único CCD, um único núcleo pode usar menos da metade da largura de banda total de leitura de memória do CCD, cerca de 55% da largura de banda de escrita e mais de 2/3 da largura de banda de leitura-modificação-escrita.
- O 9575F tem largura de banda para o CCD consideravelmente maior do que as peças Zen 5 para desktop, porque fornece 2 links GMI para o die de IO por meio do GMI3-W.
- Turin suporta até DDR5-6400MT/s, com suporte por canal por DIMM apenas em sistemas específicos. A maioria dos sistemas suporta 6000MT/s, e ao configurar 2 DIMMs por canal isso cai para 4400 MT/s.
Latência de memória
- A latência de memória sem carga do Turin é semelhante à do Genoa.
- Ao medir a latência de memória sob carga, houve aumento de cerca de 39 nanossegundos em relação ao estado sem carga quando um único CCD estava sob carga, e de cerca de 31 nanossegundos quando o sistema inteiro estava sob carga.
- A latência dentro do CCD é de cerca de 45ns, entre CCDs é de cerca de 150ns e entre sockets é de cerca de 260ns, mostrando aumento de latência em comparação com o Genoa.
Velocidade de clock
- Todos os 64 núcleos do 9575F podem atingir até 5GHz em testes de thread única, e em testes de largura de banda de memória 8 núcleos operam a 5GHz.
- No Cinebench 2024, com 128 threads em execução, o 9575F mantém cerca de 4,3GHz, enquanto em workloads de servidor web/transações TLS registra cerca de 4,9GHz.
Conclusão
- O Turin da AMD é uma atualização geracional previsível, oferecendo SKUs com alta contagem de núcleos e SKUs de alta frequência com menos núcleos para atender às necessidades de vários mercados.
- Turin está mais próximo de uma evolução de Milan para Genoa do que de uma mudança revolucionária de Naples para Rome, incluindo aumento de largura de banda de memória, aumento de contagem de núcleos e atualização dos núcleos.
- Esta geração oferece muito valor em um ecossistema competitivo e deve interessar muita gente.
Resumo do GN⁺
- O Turin da AMD representa um avanço importante no mercado de CPUs para servidores, com melhorias especialmente notáveis em largura de banda de memória e desempenho dos núcleos.
- Este artigo é útil para quem quer entender a tecnologia mais recente da AMD e pode ajudar engenheiros interessados em otimização de desempenho de servidores.
- Um produto com recursos semelhantes ao Turin é a série Xeon da Intel, e a comparação com a AMD permite entender os pontos fortes e fracos de cada produto.
1 comentários
Comentários do Hacker News
O AMD EPYC 9175F é um produto incomum com 16 núcleos e 512MB de cache L3. Parece ser voltado a clientes que querem minimizar custos de licenciamento "por núcleo". Fico me perguntando se a Oracle ainda usa esse modelo de licença
O Phoronix publicou uma análise comparando o Turin Dense de 196 núcleos com o AmpereOne de 192 núcleos
Por US$ 5,5 mil, é possível comprar um CPU AmpereOne de 192 núcleos (274W) ou um CPU Turin Dense de 48 núcleos (300W)
Tenho muito interesse no desempenho do chip de servidor da Qualcomm baseado em Nuvia
Este pode muito bem ser a era de ouro dos CPUs para servidor neste momento
Estou ansioso para ver a Hetzner disponibilizar servidores bare metal com AMD Turin
Há 20 anos, CPUs tinham só 1 ou 2 núcleos, e era sorte ter 4 núcleos em um servidor dual-socket
Para quem não gosta da mudança para o Substack, existe um site alternativo
Estou rodando um Dell PowerEdge de 12 anos com dual Xeon
ChipsAndCheese é uma das novas publicações técnicas e tem um conhecimento excepcional, especialmente em benchmarks aprofundados
Lançado em um momento perfeito para o Factorio 2.0
Quero muito ver o 9965 em ação
No vídeo, há um gráfico de TDP em 1:11