- Durante a instalação do Proxmox em uma workstation Dell Precision T3610 antiga e a tentativa de upgrade de CPU, surgiu um problema de confusão com a nomenclatura do socket
- A CPU original, Xeon E5-1650 v2, estava documentada na documentação oficial da Intel como usando socket FCLGA2011
- Foi comprado um Xeon E7-8890 v4 com a mesma indicação de socket, mas na prática não foi possível instalá-lo porque a chave física e o arranjo de contatos eram diferentes
- Após investigação, descobriu-se que o socket LGA2011 tem várias variantes, como Socket R(LGA2011-0) e Socket R2(LGA2011-1), entre outras, e a documentação da Intel as registra com a mesma denominação sem diferenciá-las
- Este caso mostra que o esquema de nomenclatura pouco claro e a má gestão da documentação da Intel podem causar confusão aos usuários e custos desnecessários
Tentativa de upgrade da workstation Dell
- Foi instalado o Proxmox na Dell Precision T3610 e realizado um upgrade para 96 GB de RAM e 13 SSDs de 500 GB
- Para o upgrade de CPU, foi procurado um modelo para substituir o Xeon E5-1650 v2 (FCLGA2011) original
- Consultando a página do produto da Intel, foi escolhido o Xeon E7-8890 v4 (FCLGA2011), comprado no eBay por cerca de US$ 15
Falha na instalação da CPU e a causa
- Embora a nova CPU tivesse fisicamente o mesmo tamanho, não pôde ser instalada devido a contatos adicionais e uma estrutura de chaves diferente
- Apesar da mesma indicação FCLGA2011 na documentação da Intel, na prática os sockets não eram compatíveis
- Uma investigação adicional mostrou que o LGA2011 possui Socket R (LGA2011-0), Socket R2 (LGA2011-1) e até uma terceira variante
- A T3610 usa Socket R
- O E7-8890 v4 usa Socket R2
- As informações relacionadas podem ser verificadas no artigo da Wikipedia sobre LGA2011
Problemas no esquema de nomenclatura da Intel
- A Intel causa confusão ao usuário ao rotular todas as variantes como FCLGA2011
- A ausência de um sistema claro de numeração de versões dificulta avaliar a compatibilidade de hardware
- Manter a mesma denominação enquanto o arranjo de contatos e a estrutura de chaves mudam é apontado como um problema de projeto e documentação ineficientes
Resultado e lições
- A CPU comprada não pôde ser instalada e acabou virando praticamente um peso de papel
- A devolução era possível, mas o frete equivalia a cerca de metade do preço da CPU, então foi deixada de lado
- No futuro, se surgir um servidor com placa-mãe Socket R2, ainda pode haver chance de reaproveitá-la
- Esta experiência foi considerada uma lição aprendida por um custo barato
- Ela reforça a importância de verificar as variantes detalhadas do nome do socket ao fazer upgrades de hardware
1 comentários
Comentários no Hacker News
Eu trabalho com segurança de CPU. Na microarquitetura existe a mesma confusão
Por exemplo, se você quer saber se uma certa vulnerabilidade afeta uma CPU específica, os especialistas falam em codinomes como “Blizzard Creek” ou “Windy Bluff”.
Mas a documentação da Intel só diz algo como “é afetado se o bit 63 do CPUID leaf 0x3aa estiver definido”. Não dá para saber isso antes de realmente dar boot.
Na ficha técnica do produto aparece “Xeon Osmiridium X36667-IA”, e esses três sistemas de nomes não se conectam entre si.
A AMD também faz algo parecido, com o número do ano aumentando de um em um, mas desalinhado com a versão do Zen.
Então no fim eu pergunto para um LLM e simplesmente aceito os 20% de respostas erradas
Eu tento exigir só recursos que sejam suportados em comum por todas as CPUs lançadas nos últimos 10 anos, mas por causa das diferenças entre Intel e AMD isso é quase impossível.
Nem dá para ter certeza se recursos como APIC, IOMMU e ACPI 2 existem em todas as CPUs. É burocrático demais
A AMD também não está livre disso. A série Ryzen 7000 é Zen 4, mas alguns modelos são Zen 2. Dá para distinguir olhando o meio do número, mas para o consumidor comum isso não significa nada
Já chegaram até a trocar codinomes entre si, o que bagunçou toda a documentação. Por isso eu passei a usar só números de modelo exatos em vez de codinomes.
Aí acontecia uma situação engraçada em que gerentes que só conheciam os codinomes ficavam em silêncio na conversa
Mesmo assim, a parte mais profunda do CPUID continua sendo dolorosa. O branding de produtos da Intel já está em nível de desastre há muito tempo
Você acha a nomenclatura da Intel confusa? A da NVidia também não fica atrás
Quadro 6000, Quadro RTX 6000, RTX A6000, RTX 6000 Ada, RTX 6000 Workstation Edition, RTX 6000 Max-Q, RTX 6000 Server Edition…
Os nomes são parecidos, mas são GPUs totalmente diferentes
Intel Core Ultra 7 155U e 155H têm nomes parecidos, mas são classes de CPU totalmente diferentes
A versão U é de baixo consumo, a H é de alto desempenho, então a diferença de preço nos notebooks também é grande.
Se a pessoa só pesquisar “155 é bom?”, vai aparecer informação da versão H, e isso confunde facilmente o consumidor
U = baixo consumo, H = alto desempenho, HX = desempenho de desktop (com consumo de energia brutal)
Dentro da mesma série, números maiores normalmente são melhores. Ex.: 275HX e 285HX são quase idênticos
Uma vez eu coloquei um Xeon E5472 de servidor em um soquete LGA775 de consumidor com uma modificação de faca e adesivo.
Era a mesma microarquitetura, mas com nomes de soquete diferentes. Por outro lado, também houve casos em que o soquete era quase o mesmo, mas deram nomes diferentes para criar artificialmente uma segmentação de mercado
Eu estava vendo CPUs usadas na CEX e percebi que a Intel era muito mais barata que a AMD, e entendi o motivo
A AMD tem compatibilidade entre gerações melhor, então mantém mais valor no mercado de usados, mas na Intel muitas vezes, se a placa-mãe quebra, você tem que trocar a CPU junto
Ao usar CPU, você sempre tem que verificar a compatibilidade com a placa-mãe. Não dá para julgar só pelo formato do soquete
Em placas retail, dá para conferir a lista de suporte no site do fabricante, e às vezes uma atualização de BIOS amplia a compatibilidade
LGA é uma estrutura em que os pinos ficam na placa-mãe e a CPU tem contatos planos, então o nome é intuitivo
Hoje em dia os fóruns morreram e a busca está uma bagunça, então a realidade é comprar, e se não funcionar pedir reembolso ou fazer chargeback
Não entendo por que a maioria das empresas de tecnologia é tão ruim para dar nomes
As pessoas acreditam que número maior é melhor
O modelo novo fica mais caro, e o antigo recebe um nome parecido para esvaziar estoque
O sistema de nomes realmente é bagunçado, mas ao comprar uma CPU nova o certo é verificar a lista de suporte do fabricante da placa-mãe
O lado bom é que, quando o nome do soquete é parcialmente o mesmo, pelo menos a compatibilidade com o cooler tende a ser mantida
A era do LGA2011 foi realmente uma geração amaldiçoada
DDR3, DDR3L, ECC e DDR4 estavam todos misturados, e algumas placas chegavam a ter slots DDR3 e DDR4 ao mesmo tempo
Havia bug no controlador SATA, capacitores defeituosos, queda de lanes PCI-E e vários outros problemas.
Por isso a Intel reprimiu com força os parceiros que faziam placas de overclock não oficial
Eu não acompanho CPUs com frequência, e há tantos codinomes, gerações e nomes de modelo que isso parece uma confusão intencional
Mas também não parece algo vantajoso para as empresas no longo prazo. Provavelmente, a cada geração o time de marketing diz “agora vamos arrumar o sistema” e acaba deixando tudo mais confuso
Só um formato do tipo “nome da era–geração–modelo–velocidade–código detalhado” já bastaria, mas eles mudam a própria classificação toda vez, então fica impossível fazer o mapeamento
Por exemplo, procuro reviews de CPU dos últimos 2 anos em lugares como Ars Technica e decido com base nisso
Mas, para desenvolvedores de baixo nível, como os de kernel ou firmware, no fim é um destino inevitável ter que acompanhar isso diretamente