1 pontos por GN⁺ 2026-03-26 | 1 comentários | Compartilhar no WhatsApp
  • A Arm apresentou o AGI CPU baseado na plataforma Neoverse, fornecendo diretamente silício pronto para produção para infraestrutura de IA autônoma
  • Esse CPU é otimizado para workloads paralelas de IA em ambientes de rack de alta densidade, mantendo alto desempenho por thread única e largura de banda de memória sob carga sustentada
  • Parceiros importantes como Meta, OpenAI e SK Telecom já iniciaram implantações comerciais, aplicando-o em diversas infraestruturas de IA, como gerenciamento de aceleradores e orquestração de agentes
  • A Arm apresentou o 1OU Dual Node Reference Server e busca expandir o ecossistema com form factor padrão OCP e ferramentas open source
  • Este lançamento marca a entrada efetiva da Arm no mercado de silício para data centers, posicionando-se como uma base central para arquiteturas de data center nativas para IA

Arm anuncia o AGI CPU: base de silício para a era da nuvem de IA agentic

  • O Arm AGI CPU é um novo produto de silício baseado na plataforma Arm Neoverse, um CPU pronto para produção projetado para impulsionar a infraestrutura de IA da próxima geração
  • Pela primeira vez em seus 35 anos de história, a Arm passa a oferecer diretamente um produto de silício, indo além de IP e Compute Subsystem (CSS) para disponibilizar opcionalmente aos clientes soluções em nível de plataforma e processadores projetados pela própria Arm
  • Trata-se de uma resposta à rápida evolução da infraestrutura de IA e ao aumento da demanda por plataformas Arm capazes de ser implantadas em grande escala

A ascensão da infraestrutura de IA agentic

  • Os sistemas de IA estão entrando em uma era de operação contínua e autônoma em escala global
    • No passado, a velocidade da interação humana limitava a velocidade de processamento dos sistemas, mas na IA agentic agentes de software interagem com múltiplos modelos em tempo real e tomam decisões
  • Com essa mudança, o CPU surge como o principal elemento de coordenação da infraestrutura moderna
    • O CPU gerencia aceleradores, memória, armazenamento, agendamento de workloads, movimentação de dados e coordena simultaneamente diversos agentes
  • O Arm Neoverse já é usado como base de grandes plataformas hyperscale e de IA, como AWS Graviton, Google Axion, Microsoft Azure Cobalt e NVIDIA Vera
  • O Arm AGI CPU foi desenvolvido para responder a essa demanda global de expansão da infraestrutura de IA

Arm AGI CPU: projetado para eficiência agentic em escala de rack

  • O Arm AGI CPU foi projetado para manter alto desempenho em tarefas individuais mesmo sob carga sustentada em ambientes paralelos de grande escala
    • Todos os elementos, como frequência de operação, memória e arquitetura de I/O, foram otimizados para oferecer suporte a workloads paralelas de IA em implantações de rack de alta densidade
  • A configuração de servidor de referência da Arm adota um design 1OU com 2 nós, com 272 núcleos por blade (2 chips, com memória dedicada e I/O)
    • Um rack de 36kW com refrigeração a ar pode acomodar 30 blades (8.160 núcleos no total)
    • Um design de 200kW com refrigeração líquida, em colaboração com a Supermicro, pode acomodar 336 Arm AGI CPUs (mais de 45.000 núcleos no total)
  • Essa configuração oferece mais de 2x o desempenho por rack em comparação com sistemas x86 atuais*
    • A largura de banda de memória é elevada, preservando a eficiência por thread mesmo sob carga sustentada
    • O desempenho por thread única baseado nos núcleos Neoverse V3 foi aprimorado, aumentando o throughput por thread

Expansão inicial no ecossistema de IA

  • O Arm AGI CPU entrou na fase de implantação comercial com parceiros importantes
    • As áreas de aplicação incluem gerenciamento de aceleradores, orquestração de agentes, densificação de serviços e aplicações, networking e expansão de computação do data plane
  • A Meta participa como parceira líder, trabalhando na otimização de infraestrutura em escala de gigawatts para a família de aplicativos Meta e na integração com os aceleradores MTIA
  • Entre os parceiros iniciais estão Cerebras, Cloudflare, F5, OpenAI, Positron, Rebellions, SAP e SK Telecom
    • Sistemas comerciais podem ser encomendados por meio de ASRockRack, Lenovo e Supermicro
  • A Arm apresentou o Arm AGI CPU 1OU Dual Node Reference Server, fornecido no form factor padrão Open Compute Project (OCP) DC-MHS
    • A empresa planeja contribuir em open source com o projeto do servidor, firmware, especificações de arquitetura de sistema, framework de depuração e ferramentas de diagnóstico e validação
    • Mais detalhes serão divulgados no OCP EMEA Summit

Um novo capítulo para a infraestrutura da Arm

  • O lançamento do Arm AGI CPU representa uma nova etapa na estratégia de data center da Arm
    • Dando suporte a uma base diversa de clientes, de nuvens hyperscale a startups de IA
  • O Arm AGI CPU é o primeiro modelo da linha de produtos de silício para data center da Arm e já pode ser encomendado
    • Os produtos seguintes estão em desenvolvimento com foco em desempenho, escalabilidade e eficiência de ponta
  • Em paralelo ao roadmap do Arm Neoverse CSS, a empresa apoiará todos os clientes de data center da Arm para que mantenham arquitetura de plataforma comum e compatibilidade de software
  • Mais de 50 empresas importantes apoiam a expansão do silício da Arm, entrando em uma fase de definição e construção direta de arquiteturas de data center nativas para IA

Resumo das falas dos parceiros

  • Cerebras

    • A escalabilidade e eficiência do Arm AGI CPU desempenham papel central na construção de infraestrutura de IA voltada para inferência em escala extrema
  • Cloudflare

    • Adota o Arm AGI CPU como infraestrutura de computação de alto desempenho e baixo consumo de energia para escalar com eficiência em sua rede global
  • Meta

    • Está co-desenvolvendo com a Arm para aumentar a densidade de desempenho em data centers e apoiar um roadmap de sistemas de IA de múltiplas gerações
  • OpenAI

    • O Arm AGI CPU deve contribuir para fortalecer a camada de orquestração de workloads de IA em larga escala e melhorar a eficiência e a largura de banda do sistema
  • Positron

    • Espera melhorar a eficiência de desempenho e custo em data centers ao combinar tecnologia de aceleração de inferência com a eficiência energética do Arm AGI CPU
  • Rebellions

    • Oferece uma plataforma otimizada para workloads de inferência em larga escala com uma configuração de servidor de alta densidade que combina Arm AGI CPU e NPU
  • SAP

    • Destaca a maturidade dos workloads corporativos baseados em Arm e expande o Arm AGI CPU como base de suporte para soluções empresariais de IA de próxima geração
  • SK Telecom

    • Está construindo uma infraestrutura de data center para inferência de IA em larga escala que integra aceleradores de IA da Rebellions e o Arm AGI CPU, com o objetivo de reforçar a competitividade em AIDC

Avisos e isenções de responsabilidade

  • Este documento inclui declarações prospectivas sobre o roadmap de produtos da Arm, desempenho e planos de implantação de parceiros
    • Os resultados reais podem variar dependendo de fatores como configuração do sistema e workloads
  • Os números de desempenho são estimativas internas da Arm e se baseiam em uma comparação em nível de rack entre um servidor com Arm AGI CPU e um servidor x86 equivalente*
  • Todos os nomes de produtos e empresas são marcas comerciais ou marcas registradas de seus respectivos proprietários

1 comentários

 
GN⁺ 2026-03-26
Comentários no Hacker News
  • O nome dessa CPU é quase uma fraude de valores mobiliários
    Hoje em dia, quando se fala em "AGI", a maioria pensa em Artificial General Intelligence, mas a Arm está chamando isso de "Agentic AI Infrastructure"
    Investidores comuns vão comprar ações da ARM sem saber a diferença, e a Arm sabe disso. Na indústria, isso é chamado de ‘mentira’

    • Hoje em dia, AGI virou apenas uma palavra de marketing. Daqui a pouco vai ter até desodorante com cheiro de AGI
    • O marketing de 5G também foi assim no passado. Chamavam de 5G mesmo antes de o 5G real ser implantado, induzindo confusão no consumidor
      Como foi tratado em uma matéria da PBS, o marketing sempre mistura termos desse jeito
    • Se os ricos são tão burros assim, então não há o que dizer se perderem dinheiro
      Quem investe sem checar nada não pode ser protegido por lei nenhuma
    • Na verdade, acho bom esse tipo de nomenclatura exagerada
      Esse marketing fantasioso pode até fazer o setor abandonar a palavra ‘AGI’ e voltar à realidade
    • Esse tipo de marketing é realmente irritante
      Pegar um termo existente e empacotá-lo com um novo significado é um truque antigo
      “Personal Computer” da IBM, “Windows” da Microsoft e “Core” da Intel foram todos assim
      (Aliás, sou um pequeno investidor da ARM)
  • Isso é simplesmente a Arm fabricando e vendendo diretamente CPUs Neoverse
    Não é uma CPU de IA. Não é diferente de Graviton, Epyc ou Xeon
    Isso já tinha aparecido alguns anos atrás no processo Qualcomm vs Arm
    A Arm planejava não apenas licenciar, mas vender CPUs diretamente; na época o CEO negou, mas no fim se confirmou
    Também escrevi um post sobre isso

    • Isso me lembra quando a Intel divulgava que o Pentium deixava a navegação na web mais rápida
    • Também pensei a mesma coisa no começo. Pelo conteúdo do blog, fica claro que a ARM quer competir diretamente com seus clientes
      Então parece que deram esse nome para surfar a onda da IA
      Mas fabricantes de hardware percebem esse tipo de pose. No fim, se não tiver competitividade em preço, não vende
    • O pior é que existem SoCs com acelerador de IA (NPU) de verdade, e isso nem sequer é um desses
  • O interessante é que a Arm está lançando um produto de silício próprio pela primeira vez em 35 anos de história

    • Engenheiros que passaram décadas vendo outras empresas usarem núcleos ARM de forma estranha parecem finalmente ter tido a chance de mostrar do que são capazes
    • A ARM fabricar chips diretamente é como se a TSMC passasse a vender sua própria CPU
      Agora a ARM passa a competir diretamente com seus clientes
    • No fim, parece que a tentação da disputa por silício para IA ficou grande demais
      Chegou o momento em que vender chips diretamente dá mais lucro do que receita de licenciamento
    • Mas a VLSI, que fez o ARM1, também era silício da ARM. Não é algo totalmente inédito
    • Para fazer isso, eles vão ter que contratar novos engenheiros de Design Verification, e isso custa caro
  • AGI é a sigla de Agentic AI Infrastructure
    Caso você tenha pensado em outra coisa, fica a referência

    • Parece uma forma poética de resumir a realidade atual do setor de IA. Uma paisagem bela, mas amarga
    • Teria sido mais engraçado chamar de AAII e anunciar como “duas vezes mais poderoso que IA”
    • Também fica confuso onde recai a ênfase em cada letra de AGI
      Pensando em como a ARM separava com clareza os perfis A, R e M, isso é decepcionante
    • Isso é simplesmente... uma coisa. Não no bom sentido de ‘uma coisa’
    • Parece pular o tubarão e ainda perder as calças no meio do salto. Intencional ou não, é marcante
  • AGI (Agentic AI Infrastructure) será adicionado à linha junto com CSS (Compute Subsystems)
    Fico imaginando quem inventa esses nomes

    • Devem ser do mesmo tipo de gente que faz “Generative AI” soar como “General AI”
      Fraude é praticamente o modo de vida básico do marketing
    • Então não é Artificial General Intelligence dando as mãos para Cascading Style Sheets?
  • É como dar ao seu filho o nome de World President Smith

    • Mas, surpreendentemente, pode funcionar
      Segundo um artigo da APA, nomes influenciam o comportamento
      O sobrenome do meu corretor de imóveis também é ‘House’
  • Hoje em dia, tudo é AGI
    Ontem era Agentic, anteontem era IA
    Daqui a pouco o supermercado vai estar cheio de papel higiênico AGI Agentic AI Crypto. Ao lado dele, provavelmente terá latas de atum UML Rational Rose

  • A Arm agora vai vender sua própria CPU diretamente

  • Não faço ideia do que significa “Built for rack-scale agentic efficiency”

    • Se você ignorar o jargão de marketing, trata-se de um sistema multicore de grande escala com 136 núcleos e 300 W de consumo, voltado para melhorar a eficiência
      Segundo a explicação da Arm, futuras cargas de trabalho agentic vão exigir CPU e GPU ao mesmo tempo, então a eficiência da CPU importa
    • Hoje em dia, estamos simplesmente na era de empilhar palavras que soam plausíveis
    • No fim, é o conceito de densidade computacional agentic: “consumo de tokens × número de agentes × espaço em rack”
    • Isso lembra o meme “mongodb is web scale”
    • Parece uma pergunta do tipo “quantos anjos podem dançar na ponta de uma agulha?”
      Veja o link da Wikipédia