Por que a Physical AI está ganhando atenção agora e o que mudou em relação ao passado
(nextbigteng.substack.com)- O investimento de VC em Physical AI aumentou de forma relevante, e uma sequência de eventos como NVIDIA GTC, Bessemer Robotics Day, IPO da Unitree, aquisição da Fauna Robotics pela Amazon e a aparição do humanoide da Figure na Casa Branca está criando momento no setor
- Ainda existe o trauma de fracassos em investimentos anteriores em robótica, mas este ciclo é fundamentalmente diferente porque os principais catalisadores estão atuando de forma composta ao mesmo tempo em paralelo, e não de maneira sequencial
- Com o surgimento de modelos fundacionais voltados ao mundo físico, como modelos de visão-linguagem-ação, modelos de direção autônoma e world models, abriu-se a possibilidade de um “cérebro robótico” de uso geral
- O gargalo na coleta de dados para treinar robôs está sendo aliviado por avanços em simulação, teleoperação e vídeo egocêntrico, ao mesmo tempo em que convergem inferência na borda, queda no custo de hardware e escassez de mão de obra como fatores macro
- Em big techs e startups, há um grande fluxo de talentos que lembra o início do boom dos LLMs, e o “momento ChatGPT” da Physical AI pode estar mais próximo do que parece
O momento atual da Physical AI
- Na semana passada, o robô Olaf apareceu no keynote da NVIDIA GTC, e vieram em seguida notícias sobre o Bessemer Robotics Day e o IPO da Unitree
- Na mesma semana, a notícia da aquisição da Fauna Robotics pela Amazon e a aparição do humanoide da Figure na Casa Branca aumentaram ainda mais a repercussão
- O financiamento de VC para o setor de Physical AI vem mostrando aumento significativo recentemente, algo que pode ser confirmado em relatório do Morgan Stanley (dezembro de 2025)
- Nas previsões para 2026, a competição em Embodied AI pode gerar resultados mais acirrados e mais importantes do que a guerra dos LLMs
Por que desta vez é diferente: ação combinada simultânea de catalisadores em paralelo
- Robótica nem sempre foi uma categoria “quente”, e muitos investidores ainda carregam as cicatrizes de fracassos anteriores (scar tissue)
- O relatório da Bessemer Venture Partners (novembro de 2025) mostra os altos e baixos dos ciclos anteriores de investimento em robótica
- O principal diferencial agora é que os catalisadores da Physical AI estão se combinando em paralelo (compounding in parallel), e não de forma sequencial
- Isso está produzindo um fenômeno de convergência fundamentalmente diferente de qualquer momento anterior
Avanço acelerado dos modelos fundacionais para Physical AI
- Está surgindo um novo tipo de modelo de IA projetado especificamente para o mundo físico
- Inclui modelos de visão-linguagem-ação (Vision-Language-Action), modelos de direção autônoma e world models
- Uma “camada de modelos fundacionais” para robótica está começando a se formar, abrindo a possibilidade de um “cérebro robótico” capaz de pensar e raciocinar em diferentes tarefas, ambientes e form factors
- Em comparação com abordagens frágeis baseadas em regras ou policies treinadas em escopo estreito e incapazes de generalizar, isso representa um salto em degrau (step-function improvement)
Alívio do gargalo de dados
- Durante anos, o fator limitante da fronteira da robótica não foi a inteligência, mas os dados
- Os dados necessários para treinar modelos robóticos (habilidades motoras, pressão, manipulação etc.) não podem ser coletados na internet
- Os dados de Physical AI são não estruturados e multimodais, e coletá-los em ambientes reais é caro e lento
- Essa limitação está sendo reduzida com os seguintes avanços tecnológicos:
- Teleoperação escalável, abordagem simulation-first, vídeo egocêntrico, world models e háptica
- As técnicas e ferramentas relacionadas estão amadurecendo rapidamente (ver material de Emily Yu, da Boost VC)
- O problema dos dados ainda não foi totalmente resolvido, mas já não é mais uma barreira intransponível como antes
Maturidade da infraestrutura de inferência no momento certo
- A inteligência robótica só é útil se puder realizar ações em tempo real
- Houve avanços decisivos em inferência na borda (edge inference)
- Computação mais eficiente capaz de executar localmente, em tempo real e on-device modelos complexos
- Em ambientes onde latência e conectividade são restrições rígidas (fábricas, canteiros de obras etc.), ação imediata é essencial, por isso esse tipo de inferência é central para sistemas de Physical AI
Hardware pronto para escalar e custos em queda
- Melhorias de hardware, comoditização e queda na curva de custos estão tornando robôs escaláveis e versáteis economicamente viáveis
- Esse é um pré-requisito essencial para transformar demos promissoras em produtos realmente implantáveis
Ventos macroeconômicos favoráveis
- As mudanças tecnológicas estão convergindo com um ambiente macro favorável
- Escassez de mão de obra, fragilidade das cadeias de suprimento e pressões geopolíticas ligadas ao reshoring estão transformando a automação de aposta no futuro em exigência estratégica do presente
- A autonomia também está se tornando mainstream na percepção pública
- Carros autônomos nas ruas, robôs humanoides servindo clientes em restaurantes etc.
Grande entrada de talentos
- O sinal mais importante é a movimentação de talentos
- Pesquisadores, desenvolvedores e fundadores estão migrando para a robótica em big techs e startups
- A escala desse movimento lembra o início do boom dos LLMs (ver relatório da Lazard de setembro de 2025)
Quando chega o “momento ChatGPT”
- Os avanços recentes são notáveis, mas o debate central mudou para o timing: quando chegará o “momento ChatGPT” da Physical AI
- Ainda não se atingiu verdadeira generalização (true generalizability) em larga escala no mundo real
- Mas, com vários catalisadores atuando de forma composta em paralelo, a trajetória sugere cada vez mais que o ponto de inflexão pode estar mais próximo do que se imaginava
Ainda não há comentários.