A industrialização da inteligência robótica incorporada (Embodied)

(medium.com)

4 pontos por GN⁺ 2026-04-04 | Ainda não há comentários. | Compartilhar no WhatsApp

Embora enormes volumes de capital e talentos de ponta estejam entrando no setor de robótica, a implantação real em campo fora de ambientes limitados, como a automação industrial, ainda é mínima
Mudanças estruturais estão ocorrendo simultaneamente, como a queda no custo dos componentes, melhoria da economia de baterias, avanço das arquiteturas de modelos e melhoria dos ambientes de simulação
Em comparação com cerca de 1 bilhão de horas de vídeos na internet, os dados de manipulação robótica somam apenas cerca de 300 mil horas no mundo todo, o que caracteriza uma limitação estrutural de dados
Com a queda nos custos de atuadores, baterias, computação e sistemas, e a alta dos custos de mão de obra, chegou-se a um ponto de cruzamento econômico em que o valor marginal da automação aumenta
Três áreas de gargalo — obtenção de dados, laboratórios de IA para robótica e provedores de soluções verticais — serão centrais para a acumulação de valor no futuro

Situação atual: o ponto de encontro entre hype e mudança estrutural

Embora muito capital esteja entrando na robótica e demos impressionantes surjam sem parar, as implantações reais em armazéns, fazendas, fábricas, hospitais e canteiros de obras ainda não diferem muito dos ambientes tradicionais de trabalho
A queda no custo dos componentes, a melhora da economia de baterias, arquiteturas de modelos mais poderosas, melhores ambientes de simulação e treinamento, além do volante de talentos criado pela entrada de capital e por ambições próximas de AGI, dão sustentação ao hype com mudanças estruturais reais
A questão central não é se a robótica tem potencial, mas se está num ponto de inflexão de adoção comercial e de consumo, e como validar o momento atual

As quatro eras da história da robótica

I. 1950–2000: entrada industrial e construção das bases

Uma era definida por mecatrônica programável, marcada pela introdução, em 1961, do primeiro robô industrial da General Motors, o Unimate, para movimentos mecânicos limitados
O Stanford Arm expandiu as capacidades multieixo e permaneceu como foco central de pesquisa até os anos 1990
Com o PLC da Modicon em 1968 e o microprocessador Intel 4004 em 1971, a inteligência de máquina passou a poder se expandir economicamente por toda a automação industrial
Nos anos 1980, com o IBM PC levando a computação ao mainstream da engenharia, os robôs passaram a se integrar como parte de um ambiente de produção digital, e não mais como instalações mecânicas isoladas

II. 2000–2010: era da robótica aberta e dos componentes móveis

Em 2007, o primeiro commit do ROS (Robot Operating System) e a plataforma de pesquisa PR2 deram à comunidade, pela primeira vez, uma camada compartilhada de software e um ambiente comum de desenvolvimento
No mesmo ano, o lançamento do iPhone pela Apple iniciou uma compressão de custos de longo prazo em toda a cadeia de sensores, baterias, câmeras, computação embarcada e eletrônicos de baixo consumo, depois aproveitada pela robótica
Universal Robots (fundada em 2005), o Roomba da iRobot (2002) e a Kiva Systems (2003) foram beneficiários diretos
A aquisição da Kiva pela Amazon em 2012 foi o primeiro sinal concreto de que a robótica podia gerar valor comercial estratégico além do entusiasmo de pesquisa

III. 2010–2020: robôs colaborativos e edge compute

Três movimentos convergiram: (1) ganho de confiabilidade comercial dos robôs colaborativos — o KUKA LBR iiwa foi o primeiro robô sensível produzido em massa a obter certificação para colaboração humano-robô, enquanto a Universal Robots continuou avançando em acessibilidade e facilidade de implantação
(2) Com o lançamento do Nvidia Jetson em 2014, o edge compute com GPU se tornou prático, aproximando IA em tempo real e visão computacional de sistemas implantáveis (CUDA em 2006 e, depois, arquiteturas baseadas em transformers)
(3) Uma mudança fundamental na stack de IA — avanços como Trust Region Policy Optimization, Model-Agnostic Meta-Learning e Non-Local Neural Networks iniciaram a substituição de pipelines manuais por percepção e controle end-to-end orientados por dados
Como resultado, a robótica saiu de regras estruturadas e hardcoded para aprendizado baseado em percepção via reinforcement learning, simulação e imitação, passando a adquirir habilidades motoras com dados em vez de programação explícita

IV. 2020–presente: Physical AI

O paper de transformers do Google em 2017 levou ao RT-1 (2022), que enquadrou o controle robótico como um problema de transformers treinados com grandes e diversos conjuntos de dados do mundo real
O RT-2 (2023) se expandiu para um modelo vision-language-action (VLA) treinado tanto com dados da web quanto com dados robóticos
A NVIDIA anunciou o Project GR00T (2024) e apresentou o GR00T N1 (2025), um modelo fundacional aberto para robôs humanoides
Surgiram novos laboratórios de modelos robóticos, como Physical Intelligence, Skild AI e Field AI
Conectividade sem fio mais rápida via 5G, teleoperação mais confiável, melhores pipelines de dados e maior capacidade do hardware em campo ampliam operação remota, software de frota e ciclos de coleta de dados

Mudança nas condições econômicas

Queda no custo de componentes e sistemas

Os principais componentes de um sistema robótico são atuadores, sensores, baterias, semicondutores/chips e estruturas mecânicas; os humanoides funcionam como um proxy razoável por incluir a maior parte deles
O Morgan Stanley decompôs o BOM do Optimus da Tesla por seção para exemplificar a contribuição de cada componente no sistema total

Atuadores

Em muitos sistemas robóticos, representam a maior parcela do custo, e a China domina o mercado, o que adiciona complexidade a casos de uso específicos e à resiliência da cadeia de suprimentos
O preço médio dos atuadores vem subindo acima da inflação, mas quando normalizado por densidade, a perspectiva real melhora de forma significativa
Precisão, controle e movimento fino em atuadores lineares elétricos continuam melhorando — o erro de rastreamento em motores lineares de ímã permanente caiu de menos de 7μm em 2003 para cerca de 0,5μm RMS em estudos posteriores

Custo das baterias

Caiu rapidamente impulsionado pela indústria automotiva e por sistemas de armazenamento em escala de rede
No caso de Li-Ion, o custo por kWh caiu cerca de 87% desde 2013 e cerca de 36% desde 2020, com perspectiva de estabilização

Custo de computação

Embora não seja um item direto de BOM, é central para a economia de longo prazo
Para que robôs superem o trabalho humano, são necessários queda contínua no custo de edge compute e melhora no desempenho de modelos parametrizados
Na série Jetson da Nvidia, o desempenho por dólar melhorou em ordens de magnitude desde 2014

Custo do sistema

Usando robôs industriais como exemplo, o custo caiu substancialmente ao longo dos últimos 30 anos e deve continuar caindo

Custo do trabalho nos EUA

O salário médio por hora em armazenagem e logística, um caso de uso representativo, subiu de forma consistente
O crescimento salarial de trabalhadores de transporte e armazenagem superou a inflação, considerando o índice com base em 2003, reforçando a importância da demanda por trabalho no setor

Aumento do valor econômico da automação

Ao combinar essas curvas de custo, vê-se que o valor marginal da automação/robótica está aumentando
Isso fica claro ao modelar em NPV, embora a "fronteira eficiente" varie conforme o modelo
- Premissas: salário e benefícios de nível inicial em armazém com base no Indeed, vida útil de 8 anos, custo de manutenção de 20% em modelo pré-pago e taxa de desconto de 10%

Principais trade-offs no ponto de inflexão da adoção

Hardware vs. inteligência — um enquadramento que reflete a diferença de abordagem entre China e EUA. A China está melhor posicionada para desenvolvimento de hardware graças à infraestrutura manufatureira e à cadeia de suprimentos existentes; os EUA saem na frente em AI/ML e nos primeiros laboratórios de modelos fundacionais de LLM. Com o tempo, espera-se maior sobreposição entre as duas frentes
Industrial vs. consumo — pegar pallets e pegar pratos parecem tarefas semelhantes na superfície, mas diferem em dinâmica de movimento, mecânica de preensão e tolerâncias de pressão. Devido à presença já consolidada de robôs e ao ROI claro em ambientes industriais, o segmento industrial deve escalar primeiro, com a popularização de humanoides domésticos vindo depois
Open source (Android) vs. fechado (iOS) — assim como a divisão Android/iOS nos smartphones, a robótica começa a se dividir entre plataformas abertas voltadas a desenvolvedores (equivalentes ao ROS, ecossistemas abertos de hardware) e sistemas fechados verticalmente integrados, com hardware, software e modelos fortemente acoplados

A stack de inteligência: além da economia

A queda no custo dos componentes aumenta a viabilidade de financiamento dos robôs, mas não explica por que a narrativa de mercado mudou de automação estreita para robôs de propósito geral — essa transição diz respeito à camada de inteligência
A robótica está saindo de percepção, planejamento e hipóteses sobre o mundo baseados em engenharia mais simples para representações aprendidas treinadas com vídeo em larga escala, demonstrações robóticas, previsão sintética e entradas multimodais

1. O problema de dados

A robótica ainda não tem um equivalente em dados ao internet scale do mundo físico
Os LLMs colheram texto e mídia digitalizados, mas o aprendizado robótico ainda depende de teleoperação, operadores humanos, hardware físico e ambientes do mundo real
Lacuna de dados: cerca de 1 bilhão de horas de vídeos na internet → cerca de 350 milhões de horas de dados de direção autônoma → cerca de 20 milhões de horas de proxies para treino de world models (como Cosmos) → cerca de 300 mil horas de dados de manipulação robótica no mundo todo (segundo relatório da Bessemer)
Nem todos os dados são gerados ou utilizáveis da mesma forma, e em geral o valor dos dados e sua escalabilidade são inversamente correlacionados

2. Melhora de desempenho da camada de inteligência

Tanto o conhecimento de mundo (world models) quanto o conhecimento de ação (modelos VLM/VLA, modelos fundacionais robóticos multimodais) estão avançando rapidamente
Conhecimento de mundo — como comportamento de objetos, fluxo de líquidos e caimento de tecidos — pode ser cada vez mais aprendido a partir de vídeo rico e modelagem
Conhecimento de ação — como um braço, mão ou humanoide específico converte instruções em movimento — ainda é específico da incorporação física, mas talvez exija muito menos dados específicos de robôs do que gerações anteriores supunham
O V-JEPA 2 da Meta foi pré-treinado com mais de 1 milhão de horas de vídeo e depois condicionado para ação com menos de 62 horas de vídeo robótico
O RT-2 do Google levou aprendizado visão-linguagem em escala web ao controle robótico real
Simuladores continuam válidos e a locomoção ainda se mapeia bem para motores físicos, mas seu papel tende a encolher. Em manipulação rica em contato, world models aprendidos tornam-se mais importantes

3. Da teoria para a solução

Modelos melhores primeiro aparecem como resultados práticos: preensão melhor, menos intervenções por teleoperação, adaptação mais rápida a novos SKUs, manipulação mais robusta e mais tempo de operação autônoma dentro de workflows limitados
O debate sobre o “momento ChatGPT” da robótica continua, mas a pergunta mais relevante é se a nova camada de inteligência já é suficiente para ultrapassar o limiar de transição de piloto para produção
Ordem de resolução da stack: obtenção de dados → laboratórios neo de robótica transformam isso em inteligência reutilizável → provedores de soluções verticais transformam isso em economia do trabalho mensurável

Áreas de interesse para investimento: três gargalos centrais

1. Escassez de disponibilidade de dados → obtenção de dados (Data Enablement)

Se a robótica está estruturalmente limitada por dados, então a obtenção de dados é uma das categorias de curto prazo mais importantes da stack
Inclui captura de dados egocêntricos e por teleoperação, geração de ambientes sintéticos, avaliação de edge cases, refinamento de sinais e criação de ciclos de feedback para melhoria do sistema
Referências úteis: Scale AI (rotulagem e anotação de dados), Mercor / Mirco1 (dados humanos)
Como na primeira onda de rotulagem de dados em IA, os negócios mais fortes provavelmente usarão uma cunha inicial de serviços/ferramentas para migrar a software de workflow de alto valor, ferramentas adjacentes a modelos e loops de dados proprietários difíceis de substituir
Desta vez, isso pode incluir hardware

2. Camada de inteligência ainda inicial → laboratórios neo de robótica (Robotic Neo Labs)

Se a camada de inteligência está ficando mais útil, mas ainda é inicial, então os laboratórios neo de robótica são a próxima área lógica
São empresas que tentam transformar modelos do mundo físico antes fragmentados em inteligência reutilizável
Há acúmulo de valor em equipes que constroem em torno de world models, action models, modelos fundacionais robóticos multimodais e ferramentas de treinamento, avaliação e implantação
Skild, Physical Intelligence e Field AI já chegaram a valuations de bilhões de dólares, iniciando um ciclo de kingmakers para laboratórios de robótica
Mais interesse do que nos laboratórios em si está no que está sendo construído ao redor e abaixo deles — equipes capazes de gerar efeitos compostos em dados, incorporação física, avaliação e eficiência de inferência podem ser as verdadeiras vencedoras
Os caminhos de exit também devem diferir dos ciclos anteriores de robótica — mais do que milestones tradicionais, velocidade, densidade de talento, dados proprietários e posicionamento técnico podem importar mais
Esperam-se mais acquihires, resultados baseados em IP e parcerias estratégicas
O interesse em inferência na borda e compute on-device especializado pode voltar a crescer, à medida que laboratórios e parceiros buscam reduzir a dependência de compute centralizado caro

3. Transformar avanço técnico em resultados reais de workflow → provedores de soluções verticais (VSP)

Se uma inteligência melhor torna os robôs mais capazes em ambientes limitados, então os beneficiários comerciais mais imediatos são as empresas que fazem sua implantação em workflows reais de clientes
Muitos workflows físicos são suficientemente restritos para serem aprendíveis, valiosos o bastante para justificar a implantação e complexos o bastante para que uma inteligência melhor fosse a peça que faltava
Casos de uso industriais e comerciais são mais promissores no curto prazo do que os de consumo — o ROI é mais claro, o problema de mão de obra é mais imediato e é mais fácil adquirir o caminho de piloto até produção
A ausência de um padrão universal de adoção é a dificuldade — clientes avaliam em uma escala deslizante entre velocidade (itens embalados por hora), precisão (percentual de itens corretamente separados) e custo (custo nivelado por hora), sendo a eficiência da mão de obra o indicador final
A expansão deve começar como complemento à força de trabalho — o ROI tende a surgir primeiro em segmentos com escassez de mão de obra e em horários de baixa disponibilidade de trabalhadores, como noites e fins de semana, quando limiares menores de velocidade e precisão justificam custos iniciais elevados e permitem ganhar escala doméstica
A próxima camada de captura de valor já é visível: integração, servicing, gestão de uptime, manutenção e financiamento
- A Formic apontou cedo essa realidade, e, à medida que os robôs passam de piloto para frota, o ecossistema ao redor também se torna investível
- Em muitos mercados, é nessa camada que empresas sustentáveis acabam sendo construídas

A industrialização da inteligência robótica incorporada (Embodied)

Situação atual: o ponto de encontro entre hype e mudança estrutural

As quatro eras da história da robótica

I. 1950–2000: entrada industrial e construção das bases

II. 2000–2010: era da robótica aberta e dos componentes móveis

III. 2010–2020: robôs colaborativos e edge compute

IV. 2020–presente: Physical AI

Mudança nas condições econômicas

Queda no custo de componentes e sistemas

Atuadores

Custo das baterias

Custo de computação

Custo do sistema

Custo do trabalho nos EUA

Aumento do valor econômico da automação

Principais trade-offs no ponto de inflexão da adoção

A stack de inteligência: além da economia

1. O problema de dados

2. Melhora de desempenho da camada de inteligência

3. Da teoria para a solução

Áreas de interesse para investimento: três gargalos centrais

1. Escassez de disponibilidade de dados → obtenção de dados (Data Enablement)

2. Camada de inteligência ainda inicial → laboratórios neo de robótica (Robotic Neo Labs)

3. Transformar avanço técnico em resultados reais de workflow → provedores de soluções verticais (VSP)

Leituras relacionadas

Ainda não há comentários.