4 pontos por GN⁺ 26 일 전 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Embora enormes volumes de capital e talentos de ponta estejam entrando no setor de robótica, a implantação real em campo fora de ambientes limitados, como a automação industrial, ainda é mínima
  • Mudanças estruturais estão ocorrendo simultaneamente, como a queda no custo dos componentes, melhoria da economia de baterias, avanço das arquiteturas de modelos e melhoria dos ambientes de simulação
  • Em comparação com cerca de 1 bilhão de horas de vídeos na internet, os dados de manipulação robótica somam apenas cerca de 300 mil horas no mundo todo, o que caracteriza uma limitação estrutural de dados
  • Com a queda nos custos de atuadores, baterias, computação e sistemas, e a alta dos custos de mão de obra, chegou-se a um ponto de cruzamento econômico em que o valor marginal da automação aumenta
  • Três áreas de gargalo — obtenção de dados, laboratórios de IA para robótica e provedores de soluções verticais — serão centrais para a acumulação de valor no futuro

Situação atual: o ponto de encontro entre hype e mudança estrutural

  • Embora muito capital esteja entrando na robótica e demos impressionantes surjam sem parar, as implantações reais em armazéns, fazendas, fábricas, hospitais e canteiros de obras ainda não diferem muito dos ambientes tradicionais de trabalho
  • A queda no custo dos componentes, a melhora da economia de baterias, arquiteturas de modelos mais poderosas, melhores ambientes de simulação e treinamento, além do volante de talentos criado pela entrada de capital e por ambições próximas de AGI, dão sustentação ao hype com mudanças estruturais reais
  • A questão central não é se a robótica tem potencial, mas se está num ponto de inflexão de adoção comercial e de consumo, e como validar o momento atual

As quatro eras da história da robótica

I. 1950–2000: entrada industrial e construção das bases

  • Uma era definida por mecatrônica programável, marcada pela introdução, em 1961, do primeiro robô industrial da General Motors, o Unimate, para movimentos mecânicos limitados
  • O Stanford Arm expandiu as capacidades multieixo e permaneceu como foco central de pesquisa até os anos 1990
  • Com o PLC da Modicon em 1968 e o microprocessador Intel 4004 em 1971, a inteligência de máquina passou a poder se expandir economicamente por toda a automação industrial
  • Nos anos 1980, com o IBM PC levando a computação ao mainstream da engenharia, os robôs passaram a se integrar como parte de um ambiente de produção digital, e não mais como instalações mecânicas isoladas

II. 2000–2010: era da robótica aberta e dos componentes móveis

  • Em 2007, o primeiro commit do ROS (Robot Operating System) e a plataforma de pesquisa PR2 deram à comunidade, pela primeira vez, uma camada compartilhada de software e um ambiente comum de desenvolvimento
  • No mesmo ano, o lançamento do iPhone pela Apple iniciou uma compressão de custos de longo prazo em toda a cadeia de sensores, baterias, câmeras, computação embarcada e eletrônicos de baixo consumo, depois aproveitada pela robótica
  • Universal Robots (fundada em 2005), o Roomba da iRobot (2002) e a Kiva Systems (2003) foram beneficiários diretos
  • A aquisição da Kiva pela Amazon em 2012 foi o primeiro sinal concreto de que a robótica podia gerar valor comercial estratégico além do entusiasmo de pesquisa

III. 2010–2020: robôs colaborativos e edge compute

  • Três movimentos convergiram: (1) ganho de confiabilidade comercial dos robôs colaborativos — o KUKA LBR iiwa foi o primeiro robô sensível produzido em massa a obter certificação para colaboração humano-robô, enquanto a Universal Robots continuou avançando em acessibilidade e facilidade de implantação
  • (2) Com o lançamento do Nvidia Jetson em 2014, o edge compute com GPU se tornou prático, aproximando IA em tempo real e visão computacional de sistemas implantáveis (CUDA em 2006 e, depois, arquiteturas baseadas em transformers)
  • (3) Uma mudança fundamental na stack de IA — avanços como Trust Region Policy Optimization, Model-Agnostic Meta-Learning e Non-Local Neural Networks iniciaram a substituição de pipelines manuais por percepção e controle end-to-end orientados por dados
  • Como resultado, a robótica saiu de regras estruturadas e hardcoded para aprendizado baseado em percepção via reinforcement learning, simulação e imitação, passando a adquirir habilidades motoras com dados em vez de programação explícita

IV. 2020–presente: Physical AI

  • O paper de transformers do Google em 2017 levou ao RT-1 (2022), que enquadrou o controle robótico como um problema de transformers treinados com grandes e diversos conjuntos de dados do mundo real
  • O RT-2 (2023) se expandiu para um modelo vision-language-action (VLA) treinado tanto com dados da web quanto com dados robóticos
  • A NVIDIA anunciou o Project GR00T (2024) e apresentou o GR00T N1 (2025), um modelo fundacional aberto para robôs humanoides
  • Surgiram novos laboratórios de modelos robóticos, como Physical Intelligence, Skild AI e Field AI
  • Conectividade sem fio mais rápida via 5G, teleoperação mais confiável, melhores pipelines de dados e maior capacidade do hardware em campo ampliam operação remota, software de frota e ciclos de coleta de dados

Mudança nas condições econômicas

Queda no custo de componentes e sistemas

  • Os principais componentes de um sistema robótico são atuadores, sensores, baterias, semicondutores/chips e estruturas mecânicas; os humanoides funcionam como um proxy razoável por incluir a maior parte deles
  • O Morgan Stanley decompôs o BOM do Optimus da Tesla por seção para exemplificar a contribuição de cada componente no sistema total

Atuadores

  • Em muitos sistemas robóticos, representam a maior parcela do custo, e a China domina o mercado, o que adiciona complexidade a casos de uso específicos e à resiliência da cadeia de suprimentos
  • O preço médio dos atuadores vem subindo acima da inflação, mas quando normalizado por densidade, a perspectiva real melhora de forma significativa
  • Precisão, controle e movimento fino em atuadores lineares elétricos continuam melhorando — o erro de rastreamento em motores lineares de ímã permanente caiu de menos de 7μm em 2003 para cerca de 0,5μm RMS em estudos posteriores

Custo das baterias

  • Caiu rapidamente impulsionado pela indústria automotiva e por sistemas de armazenamento em escala de rede
  • No caso de Li-Ion, o custo por kWh caiu cerca de 87% desde 2013 e cerca de 36% desde 2020, com perspectiva de estabilização

Custo de computação

  • Embora não seja um item direto de BOM, é central para a economia de longo prazo
  • Para que robôs superem o trabalho humano, são necessários queda contínua no custo de edge compute e melhora no desempenho de modelos parametrizados
  • Na série Jetson da Nvidia, o desempenho por dólar melhorou em ordens de magnitude desde 2014

Custo do sistema

  • Usando robôs industriais como exemplo, o custo caiu substancialmente ao longo dos últimos 30 anos e deve continuar caindo

Custo do trabalho nos EUA

  • O salário médio por hora em armazenagem e logística, um caso de uso representativo, subiu de forma consistente
  • O crescimento salarial de trabalhadores de transporte e armazenagem superou a inflação, considerando o índice com base em 2003, reforçando a importância da demanda por trabalho no setor

Aumento do valor econômico da automação

  • Ao combinar essas curvas de custo, vê-se que o valor marginal da automação/robótica está aumentando
  • Isso fica claro ao modelar em NPV, embora a "fronteira eficiente" varie conforme o modelo
    • Premissas: salário e benefícios de nível inicial em armazém com base no Indeed, vida útil de 8 anos, custo de manutenção de 20% em modelo pré-pago e taxa de desconto de 10%

Principais trade-offs no ponto de inflexão da adoção

  • Hardware vs. inteligência — um enquadramento que reflete a diferença de abordagem entre China e EUA. A China está melhor posicionada para desenvolvimento de hardware graças à infraestrutura manufatureira e à cadeia de suprimentos existentes; os EUA saem na frente em AI/ML e nos primeiros laboratórios de modelos fundacionais de LLM. Com o tempo, espera-se maior sobreposição entre as duas frentes
  • Industrial vs. consumo — pegar pallets e pegar pratos parecem tarefas semelhantes na superfície, mas diferem em dinâmica de movimento, mecânica de preensão e tolerâncias de pressão. Devido à presença já consolidada de robôs e ao ROI claro em ambientes industriais, o segmento industrial deve escalar primeiro, com a popularização de humanoides domésticos vindo depois
  • Open source (Android) vs. fechado (iOS) — assim como a divisão Android/iOS nos smartphones, a robótica começa a se dividir entre plataformas abertas voltadas a desenvolvedores (equivalentes ao ROS, ecossistemas abertos de hardware) e sistemas fechados verticalmente integrados, com hardware, software e modelos fortemente acoplados

A stack de inteligência: além da economia

  • A queda no custo dos componentes aumenta a viabilidade de financiamento dos robôs, mas não explica por que a narrativa de mercado mudou de automação estreita para robôs de propósito geral — essa transição diz respeito à camada de inteligência
  • A robótica está saindo de percepção, planejamento e hipóteses sobre o mundo baseados em engenharia mais simples para representações aprendidas treinadas com vídeo em larga escala, demonstrações robóticas, previsão sintética e entradas multimodais

1. O problema de dados

  • A robótica ainda não tem um equivalente em dados ao internet scale do mundo físico
  • Os LLMs colheram texto e mídia digitalizados, mas o aprendizado robótico ainda depende de teleoperação, operadores humanos, hardware físico e ambientes do mundo real
  • Lacuna de dados: cerca de 1 bilhão de horas de vídeos na internet → cerca de 350 milhões de horas de dados de direção autônoma → cerca de 20 milhões de horas de proxies para treino de world models (como Cosmos) → cerca de 300 mil horas de dados de manipulação robótica no mundo todo (segundo relatório da Bessemer)
  • Nem todos os dados são gerados ou utilizáveis da mesma forma, e em geral o valor dos dados e sua escalabilidade são inversamente correlacionados

2. Melhora de desempenho da camada de inteligência

  • Tanto o conhecimento de mundo (world models) quanto o conhecimento de ação (modelos VLM/VLA, modelos fundacionais robóticos multimodais) estão avançando rapidamente
  • Conhecimento de mundo — como comportamento de objetos, fluxo de líquidos e caimento de tecidos — pode ser cada vez mais aprendido a partir de vídeo rico e modelagem
  • Conhecimento de ação — como um braço, mão ou humanoide específico converte instruções em movimento — ainda é específico da incorporação física, mas talvez exija muito menos dados específicos de robôs do que gerações anteriores supunham
  • O V-JEPA 2 da Meta foi pré-treinado com mais de 1 milhão de horas de vídeo e depois condicionado para ação com menos de 62 horas de vídeo robótico
  • O RT-2 do Google levou aprendizado visão-linguagem em escala web ao controle robótico real
  • Simuladores continuam válidos e a locomoção ainda se mapeia bem para motores físicos, mas seu papel tende a encolher. Em manipulação rica em contato, world models aprendidos tornam-se mais importantes

3. Da teoria para a solução

  • Modelos melhores primeiro aparecem como resultados práticos: preensão melhor, menos intervenções por teleoperação, adaptação mais rápida a novos SKUs, manipulação mais robusta e mais tempo de operação autônoma dentro de workflows limitados
  • O debate sobre o “momento ChatGPT” da robótica continua, mas a pergunta mais relevante é se a nova camada de inteligência já é suficiente para ultrapassar o limiar de transição de piloto para produção
  • Ordem de resolução da stack: obtenção de dados → laboratórios neo de robótica transformam isso em inteligência reutilizável → provedores de soluções verticais transformam isso em economia do trabalho mensurável

Áreas de interesse para investimento: três gargalos centrais

1. Escassez de disponibilidade de dados → obtenção de dados (Data Enablement)

  • Se a robótica está estruturalmente limitada por dados, então a obtenção de dados é uma das categorias de curto prazo mais importantes da stack
  • Inclui captura de dados egocêntricos e por teleoperação, geração de ambientes sintéticos, avaliação de edge cases, refinamento de sinais e criação de ciclos de feedback para melhoria do sistema
  • Referências úteis: Scale AI (rotulagem e anotação de dados), Mercor / Mirco1 (dados humanos)
  • Como na primeira onda de rotulagem de dados em IA, os negócios mais fortes provavelmente usarão uma cunha inicial de serviços/ferramentas para migrar a software de workflow de alto valor, ferramentas adjacentes a modelos e loops de dados proprietários difíceis de substituir
  • Desta vez, isso pode incluir hardware

2. Camada de inteligência ainda inicial → laboratórios neo de robótica (Robotic Neo Labs)

  • Se a camada de inteligência está ficando mais útil, mas ainda é inicial, então os laboratórios neo de robótica são a próxima área lógica
  • São empresas que tentam transformar modelos do mundo físico antes fragmentados em inteligência reutilizável
  • Há acúmulo de valor em equipes que constroem em torno de world models, action models, modelos fundacionais robóticos multimodais e ferramentas de treinamento, avaliação e implantação
  • Skild, Physical Intelligence e Field AI já chegaram a valuations de bilhões de dólares, iniciando um ciclo de kingmakers para laboratórios de robótica
  • Mais interesse do que nos laboratórios em si está no que está sendo construído ao redor e abaixo deles — equipes capazes de gerar efeitos compostos em dados, incorporação física, avaliação e eficiência de inferência podem ser as verdadeiras vencedoras
  • Os caminhos de exit também devem diferir dos ciclos anteriores de robótica — mais do que milestones tradicionais, velocidade, densidade de talento, dados proprietários e posicionamento técnico podem importar mais
  • Esperam-se mais acquihires, resultados baseados em IP e parcerias estratégicas
  • O interesse em inferência na borda e compute on-device especializado pode voltar a crescer, à medida que laboratórios e parceiros buscam reduzir a dependência de compute centralizado caro

3. Transformar avanço técnico em resultados reais de workflow → provedores de soluções verticais (VSP)

  • Se uma inteligência melhor torna os robôs mais capazes em ambientes limitados, então os beneficiários comerciais mais imediatos são as empresas que fazem sua implantação em workflows reais de clientes
  • Muitos workflows físicos são suficientemente restritos para serem aprendíveis, valiosos o bastante para justificar a implantação e complexos o bastante para que uma inteligência melhor fosse a peça que faltava
  • Casos de uso industriais e comerciais são mais promissores no curto prazo do que os de consumo — o ROI é mais claro, o problema de mão de obra é mais imediato e é mais fácil adquirir o caminho de piloto até produção
  • A ausência de um padrão universal de adoção é a dificuldade — clientes avaliam em uma escala deslizante entre velocidade (itens embalados por hora), precisão (percentual de itens corretamente separados) e custo (custo nivelado por hora), sendo a eficiência da mão de obra o indicador final
  • A expansão deve começar como complemento à força de trabalho — o ROI tende a surgir primeiro em segmentos com escassez de mão de obra e em horários de baixa disponibilidade de trabalhadores, como noites e fins de semana, quando limiares menores de velocidade e precisão justificam custos iniciais elevados e permitem ganhar escala doméstica
  • A próxima camada de captura de valor já é visível: integração, servicing, gestão de uptime, manutenção e financiamento
    • A Formic apontou cedo essa realidade, e, à medida que os robôs passam de piloto para frota, o ecossistema ao redor também se torna investível
    • Em muitos mercados, é nessa camada que empresas sustentáveis acabam sendo construídas

Ainda não há comentários.

Ainda não há comentários.