- O setor de robótica atraiu um investimento recorde de US$ 40,7 bilhões em 2025, alta de 74% em relação ao ano anterior, passando a representar 9% de todo o capital de risco e emergindo como uma das áreas líderes em investimentos junto com software de IA
- IA física é a tecnologia central que permite que robôs aprendam a partir de dados, e não de regras pré-programadas, para operar no mundo físico
- Ao contrário dos modelos de linguagem, os modelos de IA física exigem dados reais de robôs, o que cria uma oportunidade inicial de liderança para controlar o mercado
- Mais de 70 empresas competem em 10 categorias de modelos de IA física, abrangendo dados e simulação, abordagens de modelo, modelos fundacionais e observabilidade
- A colaboração entre múltiplos robôs continua sendo o principal problema em aberto da IA física, e a empresa que resolver isso primeiro deverá liderar a expansão industrial de frotas de robôs autônomos
Principais implicações
- Dados proprietários de treinamento são a principal vantagem competitiva da IA física, e as grandes empresas de tecnologia estão buscando garantir acesso a esses dados por meio de aquisições
- A Nvidia adquiriu em março de 2025 a fornecedora de dados sintéticos Gretel por mais de US$ 320 milhões
- A Meta fez um investimento acionário de US$ 14,8 bilhões na Scale, empresa de infraestrutura de dados e desenvolvimento de modelos
- A OpenAI tentou adquirir a Medal para garantir dados de treinamento, mas a Medal lançou a General Intuition, que desenvolve modelos com esses dados
- Empresas que garantem dados proprietários de treinamento conseguem desenvolver modelos superiores, enquanto concorrentes precisam depender de acesso via licenciamento
- Garantir cedo dados de treinamento diversos e de alta qualidade é essencial para atingir escala comercial
- Modelos de mundo permitem que robôs façam previsões e planejem de forma autônoma, algo que grandes modelos de linguagem (LLMs) não conseguem alcançar
- O investimento em modelos de mundo saltou de US$ 1,4 bilhão em 2024 para US$ 6,9 bilhões em 2025
- As empresas desse segmento têm pontuação Mosaic média de 722 (top 3% de todo o mercado)
- Para ter sucesso, é necessário dispor de dados de treinamento de alta qualidade em ambientes controlados e manter parcerias estreitas com fabricantes de hardware
- A colaboração entre múltiplos robôs continua sendo o principal problema em aberto da IA física
- Empresas dos EUA captaram mais de US$ 17 bilhões em 17 rodadas
- Empresas chinesas captaram US$ 416 milhões em 15 rodadas
- Em ambas as regiões, o foco segue quase totalmente nas capacidades de um único robô, e poucas empresas estão construindo a camada de orquestração necessária para que diferentes tipos de robôs trabalhem juntos
- A empresa que resolver primeiro o problema da colaboração poderá controlar a expansão industrial de frotas de robôs autônomos
Visão geral das categorias
-
Dados & simulação
- Fornecem a base para o treinamento de robôs; robôs precisam de grandes volumes de dados de treinamento, mas a coleta de dados reais é lenta e cara
- O segmento é composto por três submercados:
- Dados sintéticos de treinamento — robótica: ferramentas que geram conjuntos de dados sintéticos, como imagens, dados de sensores e cenas 3D, sem necessidade de coleta real cara
- Fornecedores de dados de demonstração robótica: empresas que capturam dados reais, como teleoperação, trajetórias de movimento e vídeos, para aprendizado por imitação
- Plataformas de simulação para robótica: ambientes virtuais para treinar, testar e validar robôs antes da implantação física
- A escassez de dados é o principal gargalo da IA física, já que custo e disponibilidade dificultam o acesso a dados reais de treinamento
- Esses mercados têm pontuação Mosaic média em torno de 600 (metade superior em momento de mercado)
- 50% das empresas já entraram na fase de implantação, indicando que a infraestrutura de dados para IA física está amadurecendo da pesquisa para a viabilidade comercial
- Muitas empresas dependem de dados sintéticos e simulação, e a Nvidia lidera esse mercado
- No entanto, dados sintéticos sozinhos não bastam; dados reais de robôs continuam sendo essenciais para treinar modelos confiáveis
- A Scale recebeu US$ 16,4 bilhões em investimentos e está no top 1% da pontuação Mosaic
- A Scale combina geração de dados sintéticos e coleta de dados reais — incluindo teleoperação humana de robôs e dados de sensores de ambientes físicos — para expandir seu negócio de rotulagem de dados para desenvolvimento de modelos
- Empresas emergentes buscam novas fontes de dados para superar a escassez existente
- A General Intuition captou US$ 134 milhões para treinar modelos com vídeos de gameplay aplicáveis a sistemas robóticos
- A micro1 captou US$ 35 milhões com valuation de US$ 500 milhões e está construindo o maior conjunto de dados de treinamento em robótica do mundo com vídeos de interação humana
- Sem conjuntos de dados proprietários ou plataformas de simulação, empresas de robótica correm o risco de depender de licenças de líderes do mercado ou ficar para trás em tipos críticos de dados, como toque, pressão e movimento físico
-
Abordagens para modelos
- Dão aos robôs capacidades de visão, raciocínio e ação, com cada modelo sendo construído sobre outros modelos
- Permitem adaptação a novas tarefas em vez de programação rígida
- O segmento é composto por três submercados:
- Desenvolvedores de modelos visão-linguagem (VLMs): modelos multimodais que combinam entendimento visual e linguagem natural, atuando como a camada de percepção dos robôs
- Desenvolvedores de modelos visão-linguagem-ação (VLAs): sistemas de IA baseados em VLMs que combinam percepção visual, compreensão de linguagem e controle motor para converter comandos diretamente em ações físicas
- Desenvolvedores de IA de modelos de mundo: modelos que simulam mudanças no ambiente para prever relações espaciais, leis da física e causalidade
- A IA física está transformando a robótica de programação hardcoded em sistemas flexíveis e adaptáveis a tarefas, com os modelos VLA emergindo como a arquitetura líder
- Empresas líderes de robôs humanoides, como Figure, 1X e Galbot, estão construindo modelos VLA proprietários
- Big techs como Nvidia e Meta estão desenvolvendo modelos para licenciamento comercial a fabricantes de robôs
- Modelos de mundo podem ser a verdadeira inovação ao adicionar raciocínio preditivo
- Empresas como World Labs e Runway estão desenvolvendo modelos de mundo
- Enquanto VLAs reagem a entradas imediatas, modelos de mundo simulam mudanças no ambiente ao longo do tempo
- Isso permite que robôs prevejam resultados, planejem ações em múltiplas etapas e se recuperem de erros
-
Modelos fundacionais
- Combinam dados e arquitetura para oferecer inteligência robótica pré-treinada, com percepção, raciocínio e ação
- Alguns são modelos de uso geral para manipulação e outros são especializados
- Desenvolvedores podem licenciar essa inteligência e aplicá-la sem precisar construir tudo do zero
- O segmento é composto por três submercados:
- Desenvolvedores de modelos fundacionais para robótica: modelos de uso geral que ajudam robôs a ver, pensar e se mover em diferentes hardwares
- Desenvolvedores de modelos fundacionais para direção autônoma: treinados com grandes conjuntos de dados de direção, integram percepção, previsão, planejamento e controle, substituindo sistemas autônomos existentes para robotáxis, transporte rodoviário e entregas
- Desenvolvedores de modelos para colaboração entre múltiplos robôs: algoritmos multiagente que lidam com distribuição de tarefas, prevenção de colisões e tomada de decisão distribuída para permitir cooperação entre enxames de robôs
- O mercado de modelos fundacionais é extremamente dinâmico
- Gigantes de tecnologia dos EUA (Microsoft, Google, Amazon) e líderes chineses (Huawei, Baidu) competem com startups em destaque como DeepSeek e Physical Intelligence
- Muitas empresas atuam em vários tipos de modelos fundacionais
- Dados de treinamento de um domínio podem contribuir para melhorar o desempenho de modelos em outro domínio
- A Nvidia é a única empresa presente nas três categorias de modelos fundacionais, posicionando-se como infraestrutura de toda a stack de IA física
- A colaboração entre múltiplos robôs é a próxima fronteira
- Cenários como humanoides, robôs móveis autônomos e empilhadeiras autônomas trabalhando juntos em armazéns
- A colaboração entre diferentes tipos de robôs exige uma camada de orquestração para gerenciar tarefas, recursos e prevenção de colisões sem controle centralizado
- Apenas algumas startups, como Field AI e Intrinsic, além de big techs, estão perseguindo isso
- A maior parte desse trabalho ainda permanece em estágio de pesquisa, e não de implantação comercial
- Empresas com modelos proprietários podem obter margens mais altas por meio de diferenciação e integração vertical
- Empresas que licenciam IA de terceiros podem se beneficiar de custos mais baixos com a comoditização dos modelos, mas competirão mais pela velocidade de implantação e pela qualidade da integração do que pela tecnologia central
-
Observabilidade (Observability)
- Captura o que acontece quando robôs operam em produção, reduzindo a distância entre o desenvolvimento em laboratório e a implantação no mundo real
- Plataformas de observabilidade para robótica: plataformas para monitorar, depurar e otimizar robôs em desenvolvimento e produção
- Quando robôs falham ou se comportam de forma inesperada, engenheiros podem reproduzir incidentes, identificar a causa e enviar correções
- Casos extremos reais são incorporados de volta à simulação e ao treinamento para melhorar modelos e desempenho
- Foxglove e Formant são exemplos representativos: acompanham desempenho, analisam falhas e retroalimentam insights de implantação para conjuntos de dados de treinamento, simulação e modelos
- Empresas com forte observabilidade conseguem aprender com falhas e melhorar modelos rapidamente
- Situações inesperadas se transformam em vantagem de aprendizado, tornando-se um fator central para distinguir sistemas prontos para produção de protótipos de laboratório
Ainda não há comentários.