- Rodney Brooks, fundador da iRobot e ex-professor de robótica do MIT, apresenta uma visão realista sobre o exagero atual em torno de IA e robótica
- As expectativas sobre robôs humanoides são exageradas, e a suposição de que robôs com forma humana podem reproduzir todas as capacidades humanas cria promessas equivocadas
- Para lidar com a complexidade do mundo real em carros autônomos, robôs e afins, será preciso muito mais tempo do que sugerem os demos chamativos; assim como as revoluções do computador e da internet, a revolução da IA também deve levar décadas
- Brooks atualmente desenvolve carrinhos inteligentes para automação de armazéns e busca uma robótica prática que ajude o trabalho humano, em vez de substituí-lo
- Ele enfatiza que a AGI (inteligência artificial geral) talvez só seja possível daqui a 300 anos, e que pode ser difícil implementar plenamente a inteligência humana com o paradigma computacional atual
Carreira e filosofia de Brooks
- Rodney Brooks foi professor de robótica no MIT e ex-diretor do Laboratório de Ciência da Computação e Inteligência Artificial do MIT
- Fundou três empresas: iRobot (fabricante do Roomba), Rethink Robotics e a atual Robust.AI
- Nascido na Austrália, cresceu em uma família da classe trabalhadora, mas por seu talento para matemática ganhou cedo o apelido de "professor"
- Ao ler, em 1961, livros sobre eletricidade e computadores, tentou montar circuitos e construir computadores, alimentando sua paixão por robôs
- Suas empresas sempre foram projetadas para que os humanos mantenham o controle, com robôs focados em ajudar as pessoas
Projeto atual: Robust.AI e o carrinho inteligente
- A Robust.AI está desenvolvendo o carrinho inteligente Carta para armazéns logísticos
- Trabalhadores de armazém andam em média 30 mil passos por dia (cerca de 24 km), o que gera grande desgaste físico
- O Carta usa câmeras para se localizar e ajudar o trabalhador a encontrar os itens necessários, reduzindo drasticamente a distância percorrida
- Quando o trabalhador termina a separação, o carrinho vai automaticamente até a área de carga, substituindo uma caminhada de 400 pés
- O carrinho é projetado para que, assim que um humano segura a alça, o controle passe imediatamente para a pessoa
- Oferece amplificação de força para que o carrinho possa ser movido com pouco esforço, como se fosse o Superman
- Perto de escadas, ele evita se aproximar por segurança, e se um corredor estiver bloqueado, reporta isso ao sistema central
- O foco está em uma inteligência simples, mas confiável
- Em comparação com os antigos scanners de pulso que emulavam tecnologia dos anos 1980 e 1990, há menor carga cognitiva
- O objetivo é levar robôs a armazéns manuais de empresas como DHL (o maior cliente) e Amazon
- Esse mercado vale US$ 4 trilhões e deve durar por décadas, mas é pouco sexy, o que dificulta atrair investimento
A realidade e os limites da robótica
Avanço tecnológico e o problema da longa cauda
- O hardware atual, como capacidade de processamento, sensores e motores, evoluiu muito
- Com motores de cubo usados em scooters elétricas, é possível obter desempenho melhor e mais barato do que há 10 anos
- As GPUs da Nvidia foram criadas originalmente para gráficos, mas descobriu-se por acaso que são adequadas para operações de redes neurais
- As GPUs também são úteis para operações de visão como SLAM (localização e mapeamento simultâneos)
- Mas as pessoas subestimam o problema da longa cauda (long tail) dos ambientes naturais
- Brooks ouviu pela primeira vez uma palestra sobre carros autônomos em 1979 e, em 1990, houve uma condução bem-sucedida na Autobahn, na Alemanha
- Após os desafios de carros autônomos da DARPA em 2007–2008, houve previsões de que "em breve eles estariam em toda parte", mas isso levou quase 20 anos
- Mesmo hoje, eles operam apenas em pequenas áreas geográficas, por causa da longa cauda de todas as situações possíveis
Demos chamativos vs. ambiente real
- Demos chamativos não conseguem lidar com o ambiente real
- Até a Waymo ainda precisa de intervenção humana
- Ele é cético em relação ao sistema de táxis da Tesla: Elon Musk afirmou que contrataria motoristas de segurança e operadores remotos
- Leva muito tempo até a tecnologia encontrar sua forma ideal
- O PC levou décadas, do MS-DOS até a forma atual; o smartphone também, de Nokia e Palm até hoje
- A direção autônoma também precisará de muito tempo até sua adoção
A história do SLAM e sua lição
- Quando o artigo sobre SLAM foi publicado em 1985, Brooks não imaginava que veria, em vida, um Waymo no nível atual
- A ideia inicial de loop closing era importante, mas a implementação era incompleta
- Um ano depois, outro pesquisador publicou um artigo com melhorias
- Ao longo de toda a década de 1990, surgiram centenas de artigos de SLAM por ano, com melhorias graduais
- Só nos últimos cinco anos passou a ser viável implementar SLAM com visão computacional (antes era baseado em LIDAR)
- A lição: tudo exige muito mais engenharia do que se imagina, e uma tecnologia precisa esperar que outras amadureçam
O hype dos robôs humanoides
- Robôs com forma humana criam uma promessa sobre o que serão capazes de fazer
- O Roomba, por ser um pequeno disco no chão, não leva ninguém a esperar que ele vá limpar janelas
- Já a forma humana implica a promessa de fazer tudo o que um humano faz
- É isso que torna os humanoides atraentes, mas também significa vender promessas impressionantes
- O problema das mãos robóticas
- Muita gente se entusiasma com mãos robóticas, e empresas chinesas também confundem isso com destreza real
- Mas não há uma forma clara de reproduzir tudo o que humanos fazem com as mãos, e não se deve supor que cinco dedos sejam a solução ideal
- A estrutura de cinco dedos é um acidente evolutivo dos primeiros seres que saíram do mar para a terra
- As ferramentas hábeis do futuro podem ter formato de anêmona-do-mar, com muitos tentáculos
- Copiar o ser humano não é a solução ideal nem a mais eficiente em custo
- A maneira correta de pensar robôs e IA não é julgá-los apenas pela aparência
- Há muitas coisas que a tecnologia atual ainda faz com dificuldade, e o hype ignora isso
Visões sobre IA e educação
IA generativa e a importância das perguntas
- A IA generativa representa uma mudança de um sistema de valor baseado em respostas para outro baseado em perguntas
- A capacidade de fazer a pergunta certa separa o comum do excepcional
- Em filosofia, arte, robótica e IA, quem sabe fazer perguntas é especial
- A IA generativa desafia noções mantidas por muito tempo
- O argumento do quarto chinês, de John Searle: computadores não poderiam ter consciência humana
- Ao inserir chinês no ChatGPT e vê-lo responder em chinês, Brooks avalia que "o quarto chinês apareceu"
- Isso desafia o significado de compreender a linguagem
- A IA generativa é uma codificação de como interagimos com informação
- Se isso lhe fosse explicado há 15 anos, ele teria dito: "não tem como funcionar"
- O próprio fato de funcionar é surpreendente
Repensando o sistema educacional
- É preciso separar, como no sistema alemão, formação profissional e busca intelectual
- Um bacharelado em gestão de turismo é formação profissional, não busca intelectual
- A Alemanha há muito tempo separa formação profissional e universidades de elite
- Problemas no ensino de história
- Fica na simples memorização de "isso aconteceu, aquilo aconteceu"
- Não ensina por que aconteceu, nem quais ideias intelectuais levaram a isso
- Mesmo no MIT, os alunos só percebem "ah, então era por isso que ensinavam aquilo naquela aula" depois de de fato construírem algo
- O jornalismo é a melhor educação
- Você aprende sobre microcontroladores, sistemas operacionais embarcados, redes, switches e computação
- Aprende também sobre o impacto da tecnologia em pessoas reais e no mundo real
- A universidade não consegue oferecer essa conexão
Ceticismo sobre AGI e o paradigma computacional
A analogia com a alquimia de Newton
- Isaac Newton teve feitos geniais como a invenção do cálculo, a lei da gravidade e estudos de óptica
- Mas dedicou mais da metade da vida à alquimia (transformar chumbo em ouro)
- Na época, todos pensavam que era um problema químico, quando na verdade era um problema de física nuclear
- Newton tinha um modelo básico errado
- Quando Elon Musk tenta colocar foguetes em órbita, isso não se resolve com um script em Python
- É preciso resolver problemas físicos como combustão eficiente, massa, fluxo de líquidos e altas temperaturas
- Só computação não move objetos no mundo físico
Computação é o paradigma certo?
- Entre 1945 e 1965, surgiram quatro áreas
- neurociência, IA, vida artificial e abiogênese
- Todas adotaram a computação como metáfora principal
- Mas a computação é mesmo o que acontece em nosso cérebro?
- A AGI talvez só seja possível daqui a 300 anos
- Porque talvez estejamos lidando com o tipo errado de "material"
- Pode ser um fracasso inevitável, como a alquimia de Newton
Os limites da inteligência humana
- Há um problema na suposição de um poder infinito da inteligência humana
- A orca é muito inteligente, cruel e tem capacidade de resolver problemas
- Para capturar focas em águas rasas, inclina o corpo em 90 graus para esconder a nadadeira dorsal
- Mas ninguém imagina que orcas vão construir fundições e derreter metal
- Os humanos também podem ter, como as orcas, limites naturais
- Pensamos que somos infinitamente inteligentes e que resolveremos todos os problemas com tecnologia
- Mas talvez existam limites que a humanidade nunca consiga alcançar
O futuro da manufatura e as mudanças tecnológicas
Manufatura chinesa e cadeia de suprimentos
- Brooks começou a fabricar na China no fim dos anos 1990
- Recentemente, firmou contrato com a Foxconn para produzir robôs em grande escala
- Se você quer produção em massa, China/Taiwan são indispensáveis
- A força da manufatura chinesa está na cadeia de suprimentos
- Empresas manufatureiras chinesas vêm diversificando ao construir cadeias de suprimentos na Malásia, no Vietnã e em outros lugares
- Daqui a 50 anos, a Nigéria será o centro da inovação tecnológica
- Ela terá grande peso na população mundial e muitos problemas a resolver
- É a mesma lógica pela qual a China virou potência econômica: população enorme e necessidade de resolver problemas
Impressão 3D e a revolução da manufatura
- A impressão 3D pode liderar a manufatura
- Ainda não, mas já começou a ser usada em peças mecânicas
- A neozelandesa Electron fabrica motores de foguete com impressão 3D (algo viável por serem produtos de alto valor)
- Quando a impressão 3D se popularizar, a cadeia de suprimentos vai migrar para um foco em matérias-primas
- A dinâmica da cadeia de componentes, que é uma força da manufatura chinesa, será completamente rompida
- No fim, todos os itens serão produzidos por impressão 3D
- Assim como países em desenvolvimento adotaram TI e sistemas de pagamento mais rápido do que os EUA, a impressão 3D também se espalhará mais rápido no mundo em desenvolvimento
O paradoxo dos empregos industriais
- Em um discurso de formatura na Brown University, Brooks fez a pergunta
- "Algum pai ou mãe quer que seu filho trabalhe em uma fábrica?" → ninguém levantou a mão
- "Alguém quer que trabalhe numa empresa de tratamento de esgoto?" → ninguém
- Lamentar a perda de empregos industriais é hipocrisia
- "Não para nós, mas para os pobres"
- Exemplo da nova fábrica da BYD
- Em uma fábrica do tamanho de San Francisco, só 40 mil pessoas são empregadas
- Todo o resto são robôs feitos pela própria BYD
- Esse é o futuro da manufatura em larga escala
- Os "empregos industriais" de que os políticos falam serão muito diferentes daqui a 25 anos, considerando a revolução da robótica e da impressão 3D
Outros avanços tecnológicos
- Aplicação de IA ao desenvolvimento de materiais
- É possível prever propriedades dos materiais, sem precisar criar e testar tudo manualmente
- Mudanças em materiais, impressão 3D, robótica e outras tecnologias vão se combinar
- Não sabemos exatamente como isso será, mas com certeza será diferente
O ciclo de hype da IA e o realismo
A repetição da história da IA
- Brooks se define como realista
- Viveu inúmeros ciclos de hype na área de IA
- Antes isso não era popular entre o grande público, mas entre os profissionais de IA havia debates ferozes e muitos gritos
- As redes neurais dominam agora, mas já dominaram 4 ou 5 vezes antes e depois perderam força
- Outra coisa assume o lugar, e depois elas voltam
- Exemplo da IA baseada em agentes
- De repente, todo mundo começou a lançar IA baseada em agentes
- Seis meses antes isso nem existia → o marketing está à frente da realidade
- O primeiro artigo sobre IA agente foi publicado em 1959 por Oliver Selfridge
- Já houve vários sistemas baseados em agentes, como SOAR, e a cada retorno eles melhoram
Investimento e desperdício
- Está sendo despejada uma quantidade enorme de dinheiro, e isso vai ter impacto
- Mas boa parte será desperdiçada
- O lado positivo: o caso da superconstrução de redes
- Houve superconstrução de redes, mas isso permitiu que o Google construísse infraestrutura barata e oferecesse busca
- Data centers também serão superconstruídos
- Depois do colapso do treinamento de modelos de IA generativa, será preciso pensar em como usar esses data centers
- Não será mineração de Bitcoin, mas gente inteligente vai encontrar novos usos
- Alguém hoje desconhecido e trabalhando na pobreza acabará provocando o próximo boom
O papel da computação quântica
- Nos próximos 10 anos, computadores quânticos eficazes serão usados para simular sistemas físicos
- Fazer computação clássica muito melhor do que hoje ainda está longe
- Piada antiga: "Não sei quando os computadores quânticos vão chegar, mas parece que serão movidos a fusão nuclear"
- Agora já existem abordagens mais diversas para fusão nuclear
- Por um bom tempo, a computação quântica ficará focada na simulação de sistemas físicos
Conclusão: otimismo realista
- Não devemos julgar apenas pela aparência
- Há muitas coisas muito difíceis com a tecnologia atual
- O hype da robótica e da IA ignora o que ainda não entendemos bem
- Copiar o ser humano não é a solução ideal nem a mais eficiente em custo
- Brooks acredita que os humanos vão se sair bem em um mundo cheio de robôs e IA
- O avanço tecnológico leva muito mais tempo do que se imagina, mas no fim evolui na direção de melhorar nossa vida
1 comentários
Opiniões no Hacker News
Uma citação realmente muito marcante: a própria forma física do robô promete “o que esse robô consegue fazer”. Por exemplo, o Roomba tem formato de pequeno disco, então espera-se que ele limpe o chão, mas não que limpe janelas. Já um robô humanoide faz a promessa de que “consegue fazer tudo o que um humano faz”. Por isso ele é tão atraente para as pessoas — está vendendo uma promessa enorme
Sempre pensei em algo parecido sobre modelos de linguagem: a aparência linguística sugere “o que esse modelo consegue fazer”. O Clippy é um pequeno clipe de papel em desenho, então ninguém espera que ele escreva um grande romance, mas sim que ofereça uma ajuda limitada. Já quando algo conversa em linguagem humana, passa a sensação de que “consegue fazer tudo o que um humano faz”, e isso é recebido como uma promessa gigantesca
O motivo de todas as empresas perseguirem robôs humanoides é que já construímos o mundo em torno desse “form factor” e, evolutivamente, também nos adaptamos a ele. É um design totalmente genérico. O motivo de a OpenAI ter perseguido LLMs é parecido. No começo isso certamente atrai expectativas exageradas, mas, do ponto de vista de investimento, ainda acho que vale a pena tentar esse form factor. Desde que haja viabilidade de execução
Ri na parte que diz que “Brooks acredita que a Nigéria vai se tornar um centro econômico e tecnológico só pelo tamanho da população”. Acho engraçada a suposição ingênua de que ter muita gente automaticamente transforma um país em potência econômica. Sou crítico ao Partido Comunista Chinês por vários motivos, mas a governança eficaz e eficiente que alcançou nos últimos 40 anos não é algo fácil de replicar. Boa governança é um ativo realmente raro. Assim como a Índia tem muita população, mas não uma governança eficaz, a chance de a Nigéria ser tão bem administrada quanto a China é praticamente zero
Não concordo com a afirmação de que a Índia tem muita população, mas não boa governança. Como indiano, olhando a mudança desde a independência até hoje, foi uma conquista realmente impressionante
A China está investindo pesadamente na Nigéria e é o maior credor do país. Então talvez o governo nigeriano não seja tão diferente assim do Partido Comunista Chinês
Tendência de crescimento do PIB per capita da Índia
Concordo com a opinião sobre a Nigéria, mas discordo quanto à Índia. Ouvi dizer que o governo indiano também tem gente muito competente. E, na África, também existem países em forte crescimento, como o Quênia
Isso é quase igual ao que o Brooks publicou diretamente alguns anos atrás. Também apareceu no HN recentemente. Já existem muitas empresas vendendo automated guided cart.<br>No começo eu achava robôs humanoides ridículos, mas mudei de ideia quando vi o preço. O Unitree G1 custa US$ 22 mil, menos que um Toyota Corolla. Um hardware que eu imaginava ser caríssimo, como o da Boston Dynamics, já ficou barato nesse nível. Ainda é um produto inicial, com volume de produção baixo, mas o preço vai cair mais, e vai chegar o dia em que um robô humanoide será mais barato que um carro.<br>Para tarefas individuais, ele oferece muito mais graus de liberdade do que o necessário, mas a redução de custo trazida pela produção em massa e a vantagem de substituição de peças serão muito maiores. O problema de manipulation ainda continua, mas com um preço tão razoável e hardware padronizado, muito mais gente vai poder tentar resolver isso. Discussão anterior no HN
Mesmo que o Unitree G1 apareça por US$ 22 mil, ouvi dizer que, quando se tenta comprar em volume de verdade, incluindo hardware, ferramentas e kit de desenvolvimento, o custo fica em US$ 80 mil a US$ 100 mil por unidade. E esse post do Brooks também é recente
Em nenhuma faixa de preço alguém resolveu o problema de manipulation até agora. Produção em massa não resolve isso
Quando vejo essa faixa de preço, fico me perguntando como uma empresa americana de robótica, como a Tesla, conseguiria competir com um custo de fabricação tão baixo
Esse cara é realmente impressionante. Talvez por ser de Boston, a realidade é que ele já fez duas startups de robótica darem certo, mas tem dificuldade para captar investimento porque a ideia não é “sexy”. Investidores querem algo certo, mas acho que, se alguém teve dois grandes sucessos, a chance de acertar na terceira também é alta
Tendo passado por VC, eu não acredito no discurso superficial. Acho que você está certo. Os investidores querem investir, mas os termos que ele pede (por exemplo, US$ 1 milhão por uma valuation de US$ 2 milhões, 50% de participação) são caros demais. Com esse histórico, qualquer investidor toparia esse negócio. Ele também acha que, para fazer uma terceira startup, precisa conseguir isso, e para o investidor isso pesa
Tenho um conhecido que é um fundador realmente discreto e, nos últimos 20 anos, abriu três empresas parecidas, com praticamente o mesmo conceito (as duas primeiras foram vendidas). Se existe precedente, o mercado de capital dá muita confiança à possibilidade de sucesso futuro.
VCs querem mais uma narrativa nova (ou “hype”) do que uma reputação brilhante. Na verdade, reputação pode até jogar contra. Eles preferem a recompensa de descobrir joias escondidas, talentos que eles próprios garimparam
A iRobot perdeu para concorrentes chineses, a Rethink fracassou cedo por baixa qualidade, e a Universal fez cobots muito melhores. Não vejo sentido em uma nova startup. Só em Boston já existem mais de 10 startups de automação de armazéns
Precisamos definir “sucesso”. A iRobot foi líder de categoria e abriu um novo mercado, mas parece que quase nunca foi lucrativa de fato. Hoje está sendo superada por produtos chineses com metade do preço e o dobro do desempenho. Ainda assim, reconheço que criou o mercado. Sobre a segunda empresa, só encontro registro de uma venda em nível de “desmontagem para peças”. Essa startup atual também é interessante, mas já há concorrentes demais no mercado. Então, para mim, essa pessoa nunca teve um sucesso de verdade e agora está atuando em um oceano vermelho
Para que robôs humanoides tenham valor em larga escala, não é necessário que AGI exista. Teleoperação está sendo mais subestimada do que deveria. No curto prazo, alguém em algum lugar do mundo vai operar remotamente esses robôs para fazer entregas e várias outras tarefas de forma muito mais barata
Tenho dúvidas se esse rumo é realmente desejável
Isso realmente aumenta a eficiência em algo além de simplesmente reduzir salários?
“Inteligência artificial simples — aquilo que hoje conseguimos implementar de forma confiável. Não é sexy, mas é uma tecnologia que torna o trabalho dos trabalhadores mais fácil e eficiente.” Acho que esse é o resumo perfeito
Tenho experiência dando aulas grandes no MIT. Hoje de manhã peguei um Uber e perguntei ao motorista em que rua estávamos, e ele simplesmente não fazia ideia. Só seguia o GPS. Quando surge um problema, ele não pensa em resolver por conta própria. Eu também moro em uma cul-de-sac, então o Uber tem dificuldade para encontrar o caminho. Mesmo tentando orientar por voz, os motoristas nem leem as placas das ruas. Só seguem o ponto (destino) e ainda reclamam. O destino real, em termos de via acessível, fica do outro lado. Um motorista chegou a dar a mesma volta errada duas vezes e depois cancelou. Táxis não eram grandes coisas, mas pelo menos os motoristas tinham um conhecimento mínimo da região
Mesmo um braço robótico simples já poderia ajudar muito em áreas como construção e agricultura, que em grande parte do mundo ainda não foram devidamente industrializadas. Por exemplo, na Europa, a agricultura está sendo abandonada por causa da queda populacional e do envelhecimento. Para assentar tijolos em si não é necessário ser humanoide, mas equipamentos baratos poderiam ajudar até na crise habitacional.<br>E, embora IT forte, sensores e até algum movimento já sejam possíveis, há exigências tão diversas no ambiente natural que uma “plataforma única e genérica” é inviável. A eficiência humana também não é grande, então fico pensando por que exatamente seria necessário um formato humanoide. O que precisamos é de uma “plataforma robótica modular”, sustentada por grandes empresas ou por um sistema operacional
As affordances fornecidas pelo próprio carrinho reduzem o quanto o trabalhador precisa pensar. Quando se olha o chão de fábrica, mesmo nos lugares mais modernos, ainda entregam às pessoas apenas uma telinha rodando software com interface baseada em caracteres dos anos 80 ou 90 e um scanner de código de barras. Na prática, é preciso ler na tela qual número e qual tarefa executar. No fim, trabalhadores com capacidade de decodificar texto serão demitidos, e só serão necessárias unidades obedientes adaptadas ao robô
“É fácil captar investimento com promessas, mas o negócio real é difícil porque há limites de crescimento. Quando você não sabe, pode continuar ampliando o sonho; mas, à medida que os limites ficam claros, captar investimento também se torna, na prática, mais difícil.” Vídeo relacionado no YouTube