20 pontos por GN⁺ 2025-12-24 | 1 comentários | Compartilhar no WhatsApp
  • Foi revelado que o scheduler Linux SCX-LAVD, projetado para o Steam Deck da Valve, também funciona de forma eficaz no ambiente de servidores em grande escala da Meta
  • Esse scheduler foi projetado com o objetivo de gerenciamento eficiente de recursos em nível de console de jogos, e a Meta busca com ele melhorar o desempenho das cargas de trabalho de servidor e minimizar a latência
  • A estrutura de Latency-criticality Aware Virtual Deadline voltada para dispositivos portáteis sensíveis à latência também demonstrou desempenho e estabilidade em servidores hyperscale
  • Em comparação com o scheduler EEVDF existente, apresenta desempenho semelhante ou melhor e consegue se adaptar a várias configurações de hardware
  • A Meta está avaliando o SCX-LAVD não como algo de uso específico, mas como candidato a scheduler padrão de servidor
  • Um caso raro em que uma tecnologia feita para hardware de jogos foi expandida para grandes data centers

Contexto da apresentação na Linux Plumbers Conference 2025

  • Engenheiros da Meta apresentaram o tema na Linux Plumbers Conference 2025, realizada em Tóquio
  • O título da apresentação foi “How do we make a Steam Deck scheduler work on large servers”, explicando o processo de expansão de um scheduler para dispositivos portáteis ao ambiente de servidores
  • Eles compartilharam a experiência de validar e ajustar para o ambiente de servidores um scheduler projetado para o Steam Deck

Visão geral do scheduler SCX-LAVD

  • O SCX-LAVD foi projetado como um scheduler Latency-criticality Aware Virtual Deadline
  • Foi desenvolvido para o ambiente do Steam Deck da Valve com foco em baixa latência e desempenho estável
  • Usa uma arquitetura de scheduler extensível que roda sobre o framework Linux sched_ext
  • Com isso, a Meta espera reduzir a latência, melhorar a consistência de desempenho e aumentar a eficiência dos servidores
  • Como o projeto da Valve foi pensado para exigências de processamento em tempo real para jogos, ele também oferece uma estrutura vantajosa para gerenciamento contínuo de carga em servidores

Resultados da aplicação no ambiente de servidores da Meta

  • Foi confirmado funcionamento estável em várias configurações de CPU e memória dos servidores da Meta
  • O desempenho de balanceamento de carga entre fronteiras de CCX e LLC mostrou-se excelente
  • Em ambientes onde não é necessário um scheduler otimizado para workloads específicos, ele é adequado como opção padrão

Scheduler existente e outros casos de uso

  • O SCX-LAVD mostra desempenho semelhante ou melhor em comparação com o scheduler EEVDF
  • Já está sendo usado em ambientes Linux para jogos, como CachyOS Handheld Edition e Bazzite
  • Trata-se de um scheduler cujo desenvolvimento foi liderado pela Igalia por meio de contrato com a Valve

Direção futura de uso pela Meta

  • A Meta se refere ao SCX-LAVD como “Meta’s New Default Scheduler”
  • Ele está sendo avaliado como um scheduler de uso geral que pode ser aplicado amplamente em toda a frota de servidores em grande escala
  • Mais detalhes de pesquisa e análises de desempenho foram publicados no vídeo da apresentação da LPC e no material de slides

1 comentários

 
GN⁺ 2025-12-24
Comentários do Hacker News
  • A Valve está, na prática, liderando sozinha o avanço do ecossistema Linux
    Proton/Wine evoluíram muito para rodar jogos de Windows no Linux, e graças ao Steam Deck o Wayland também passou a ter suporte a HDR e VRR
    O escalonador criado para melhorar o frame pacing agora está sendo usado até nos data centers da Meta
    No fim das contas, a eficiência dos servidores da Meta melhorou porque a Valve pagou a Igalia para reduzir as travadas de frame em Elden Ring. Esse é o verdadeiro ciclo virtuoso do open source
    • Ao tentar reduzir as travadas de frame nos jogos, acabaram obtendo resultados otimizados no compilador de shaders da stack gráfica open source
      Aviso relacionado: Steam Community Announcement
    • O desenvolvimento de jogos ainda é uma área subestimada
      Inúmeras otimizações de software e hardware surgiram a partir do desenvolvimento de jogos
      Com o preço da RAM subindo de novo, tomara que o setor volte a focar em otimização e reduza cargas desnecessárias em toda a indústria
    • Houve várias distribuições Linux voltadas para desktop, mas a maioria estava naquele estado de “tecnicamente funciona, mas você precisa aceitar vários incômodos”
      Até a Valve entrar diretamente nisso, não havia ninguém para resolver esses problemas
    • Com o tempo, parece que a Valve vai acabar mexendo até em coisas que a Microsoft vem adiando há anos
      Acho muito melhor mudar as coisas por conta própria do que ficar esperando
    • Foi graças aos jogos que a indústria de GPU estava pronta para o boom da IA
      Historicamente, o desenvolvimento de jogos sempre esteve na linha de frente da otimização de software
  • É interessante que a Valve toque o desenvolvimento relacionado a Linux com uma estrutura centrada em contratadas como a Igalia
    Ouvi dizer que o Proton também foi feito de forma parecida. A Valve parece usar muitos contratos externos em vez de depender só de equipe interna
    • A Igalia é uma empresa incomum que organiza de forma estruturada patrocínios de desenvolvimento open source para várias empresas
      Trabalha com companhias diversas, como o Google, e lida de forma eficiente com questões complexas de pagamento e benefícios
    • A Valve concentra internamente apenas jogos, hardware e distribuição, e delega outras áreas a contratados especializados
      Acho que isso explica por que a estrutura é eficiente em custos e ainda entrega resultados de alta qualidade
      Claro que a Valve também tem suas controvérsias, mas é preciso reconhecer os pontos bons e ruins
    • A Valve é uma organização horizontal pequena, com cerca de 350 a 400 pessoas
      Por isso, expandir por meio de contratados é muito mais fácil do que aumentar o número de funcionários fixos
    • O Proton é um projeto construído em conjunto por desenvolvedores internos da Valve, pela CodeWeavers e pela comunidade
      Áreas técnicas muito específicas, como conversão de DirectX→Vulkan e OpenGL→Vulkan, são terceirizadas para organizações como a Igalia
    • A Valve tende a manter o quadro de pessoal o menor possível
      Para projetos fixos e de alta complexidade como esses, terceirizar faz sentido para qualquer empresa
  • sched_ext é um escalonador desenvolvido na Meta
    Várias empresas estão colaborando e desenvolvendo juntas no repositório compartilhado no GitHub
  • Tenho curiosidade sobre o quão bom está o game streaming no Linux
    O suporte ao Windows 10 vai acabar, então estou pensando em migrar de vez para Linux
  • Estou usando o Bazzite Desktop como sistema principal há 4 meses, e agora o Windows parece praticamente um software abandonado
    Mesmo com atualizações, continua pesado e difícil de administrar
    • O Bazzite não é uma distribuição focada em jogos?
      Fazer tudo em cima dele parece meio estranho. É como usar Excel num Steam Deck
  • A magia do open source é que a Valve não exige algo como licenciamento enterprise
    • Sim, mas a Red Hat não é obrigada a divulgar o código-fonte se não distribuir os binários do RHEL
      A Meta também pode manter seu Linux com patches próprios fechado, desde que use isso só internamente nos servidores
    • É surpreendente que um escalonador para console portátil funcione tão bem também nos servidores do Facebook
    • Por outro lado, o SteamOS e várias distribuições Linux também adotaram o escalonador de I/O Kyber da Meta para resolver microstutter
      É uma relação de influência mútua
    • Pensando bem, talvez os 30% de taxa pagos na compra de jogos na Steam sejam uma espécie de custo de licenciamento
  • É interessante que a Meta tenha aplicado o escalonador da Valve em servidores
    Fico curioso sobre como esse experimento começou
    • Provavelmente algum engenheiro testou, percebeu ganho de desempenho e isso se espalhou de baixo para cima
      É assim que muita inovação acontece até em grandes empresas
  • Acho melhor ver o vídeo original em vez da matéria do Phoronix
    Link do YouTube
    • A vida fica muito mais fácil no momento em que você deixa de confiar em vídeos do YouTube como fonte primária
    • Surpreendente chamar o Phoronix de spam de blog
  • Fico curioso sobre que tipo de workload de latência ultrabaixa a Meta roda para precisar desse tipo de escalonador
    • Segundo o vídeo, os workers em Erlang do WhatsApp exigem latência abaixo de um milissegundo
    • Provavelmente por causa do sistema de leilão de anúncios
    • Numa empresa gigante como a Meta, latência vira diretamente perda de negócio
    • A Meta sempre mira em “o mais rápido possível”, às vezes até mais do que o necessário
    • Se reduzir só 1% em 50 mil servidores, já são 50 máquinas a menos; a 8 mil dólares cada, isso representa 400 mil dólares por ano em economia
      Na escala da Meta, o impacto real seria ainda maior
  • É interessante ver workloads de servidor adotando ideias vindas de outras áreas
    Recentemente vi sistemas operacionais dedicados ao Kubernetes aplicando atualizações como o Android
    • Dá vontade de responder perguntando se isso quer dizer sistemas imutáveis