1 pontos por GN⁺ 2024-02-25 | 1 comentários | Compartilhar no WhatsApp

Falha na descompressão do Oodle causada por instabilidade em processadores Intel

  • A RAD reconhece um problema que pode causar falha na descompressão do Oodle Data ou travamentos em jogos feitos com Unreal Engine.
  • Esse problema afeta principalmente os processadores Intel 13900K e 14900K, e afeta menos os 13700, 14700 e processadores relacionados.
  • Apenas uma pequena parte desses processadores apresenta esse comportamento.
  • O problema ocorre devido à combinação das configurações da BIOS com as altas velocidades de clock e o consumo de energia desses processadores, causando instabilidade do sistema e comportamento imprevisível sob alta carga.

Problema de hardware, não bug de software

  • Não parece que um bug de software no Oodle ou no Unreal esteja causando esse problema.
  • As configurações da BIOS estão otimistas demais, fazendo com que alguns processadores operem fora da faixa funcional sob alta carga, e que velocidades de clock e consumo de energia levem à execução de instruções incorretas.
  • A descompressão do Oodle Data precisa realizar verificações adicionais de integridade dos dados, então, ao contrário de outros códigos de gameplay, simulação, áudio ou renderização, ela detecta inconsistências muito rapidamente.

Tipos comuns de falha ao iniciar jogos baseados em Unreal Engine

  • O tipo de falha mais comum é a mensagem de erro "DecompressShader(): Could not decompress shader (GetShaderCompressionFormat=Oodle)".
  • Esse problema não afeta apenas o Oodle, e sistemas que sofrem dessa instabilidade também falham em programas padrão de benchmark e teste de estresse.
  • Programas que usam intensamente o processador com muitas threads podem causar travamentos ou comportamento imprevisível.

Workarounds para resolver o problema

  • Não há acesso às informações do processador necessárias para diagnosticar a causa exata e a melhor solução.
  • Muitos fabricantes de placa-mãe/BIOS enviam seus produtos com configurações que empurram o processador para fora da faixa operacional segura.
  • Como apenas uma pequena parte dos processadores é afetada, alguns usuários conseguiram devolver o processador ao fabricante e receber um novo sem o problema.
  • Outros workarounds exigem o uso de utilitários de ajuste ou alterações nas configurações da BIOS.
  • Foi relatado por muitas pessoas que usar o Intel XTU para reduzir o multiplicador dos Performance Cores de x55 para x54 ou x53 é uma solução eficaz.

Recomendações para alterar as configurações da BIOS

  • Se o overclock estiver ativado, desative-o e evite usar overclock "AI" ou "automático".
  • Consulte os limites corretos do seu processador em ark.intel.com e ajuste limites de energia e tensão para a faixa segura recomendada pela Intel.
  • Desative configurações da BIOS de "turbo aprimorado" ou "multithreading aprimorado", como "ASUS MultiCore Enhancement" ou "ASUS Performance Enhancement 3.0".

Etapas adicionais de solução de problemas para placas-mãe Intel, ASUS, Gigabyte e MSI

  • Instale o Intel XTU e execute o teste AVX2.
  • Se o teste AVX2 falhar, tente alterações específicas nas configurações da BIOS para placas-mãe ASUS, Gigabyte e MSI.

Sem suporte direto ao usuário final

  • Não é possível oferecer suporte direto aos usuários finais dos jogos afetados por esse problema, e é recomendado usar os canais oficiais de suporte das publicadoras dos jogos e dos fabricantes do processador e da placa-mãe.

Opinião do GN⁺

  • Esse problema é importante para usuários que usam determinados processadores Intel, e pode ser necessário ajustar as configurações da BIOS para garantir a estabilidade do sistema.
  • Alterar configurações da BIOS pode ser arriscado, então os usuários devem ter cautela e buscar suporte oficial.
  • Este texto fornece medidas concretas para resolver erros de software causados por um problema de hardware, oferecendo informações úteis para usuários que enfrentam dificuldades técnicas.

1 comentários

 
GN⁺ 2024-02-25
Comentários do Hacker News
  • Compartilha a experiência com um AMD Threadripper 3970X e o processo de resolução do problema. Investigou a questão com a AMD por vários meses e recebeu compensação da empresa. No fim, está usando o sistema com uma imagem de BIOS personalizada fornecida pela AMD. O problema parece ser responsabilidade da Gigabyte.
  • Havia um defeito em uma CPU Intel 13900k, e os problemas ocorriam com as configurações padrão. O sistema travava com frequência, e muito tempo foi gasto tentando resolver a questão. A CPU foi substituída e foi solicitado um RMA à Intel, mas a empresa tentou evitar o RMA alegando suporte a Linux. O RMA foi feito por meio de órgãos de defesa do consumidor na Europa, e um novo sistema foi comprado enquanto o antigo foi vendido. Não pretende comprar produtos da Intel no futuro.
  • Menciona de forma sarcástica que, para mitigar problemas de segurança, seria preciso desativar hyper-threading, modo turbo, estados C, núcleos de eficiência e outros recursos, o que seria como voltar ao conjunto de funcionalidades de 20 anos atrás.
  • Montou um novo sistema com uma CPU i9 149kf e uma placa-mãe Asus Formula, mas enfrentou dificuldades até conseguir operá-lo de forma estável. Com as configurações padrão, surgiam problemas como travamentos em jogos e falhas na compilação do kernel e do emacs. Estabilizou o sistema limitando o turbo a 5.4GHz e ativando configurações para limitar a potência máxima e a temperatura. Agora o sistema está estável, mas lamenta não conseguir aproveitar totalmente o desempenho anunciado.
  • Menciona que isso faz lembrar um texto clássico de Raymond Chen.
  • Recorda o problema antigo da CPU Pentium III 1.13 GHz.
  • O descompressor do Zstd costuma ser o primeiro a interagir com dados transmitidos pela rede, por isso é muito sensível a bit flips. Mesmo com a verificação de erros ativada, ele detecta problemas de hardware com mais frequência do que outros processos. O Zstd inclui apenas o checksum dos dados originais para garantir a integridade dos dados, o que dificulta determinar se houve corrupção nos dados comprimidos.
  • Parece ser uma página criada para responder às reclamações indesejadas de usuários que tentam rastrear logs de erro de "oodle". Isso lembra o caso do SQLite em 2006.
  • Compartilha a experiência de ter comprado uma placa-mãe ASUS TUF. Queria apenas recursos básicos, mas as configurações da BIOS incentivavam overclock excessivo, o que o obrigou a ajustar manualmente várias opções, incluindo os timings da RAM.
  • Expressa surpresa ao descobrir que a Epic Games adquiriu a RAD.