- O Toyota Research Institute (TRI) anunciou um avanço no ensino de novas habilidades a robôs usando uma abordagem de IA generativa baseada em Diffusion Policy.
- Essa nova abordagem melhora significativamente a utilidade dos robôs e representa mais um passo na direção de construir para eles "Large Behavior Models (LBMs)", semelhantes aos Large Language Models (LLMs) que revolucionaram a IA conversacional.
- Como essa nova técnica de treinamento gera comportamentos eficientes e de alto desempenho, os robôs podem apoiar as pessoas com mais eficácia.
- As técnicas anteriores de treinamento de robôs eram lentas, inconsistentes e ineficientes, e a maioria se limitava a tarefas de escopo restrito executadas em ambientes muito limitados.
- Usando a nova abordagem, o TRI ensinou aos robôs mais de 60 habilidades difíceis e que exigem destreza, como servir líquidos, usar ferramentas e manipular objetos deformáveis.
- O TRI tem como meta ensinar centenas de novas habilidades até o fim deste ano e 1.000 até o fim de 2024.
- Os robôs do TRI agora podem interagir com o mundo de maneiras diversas e ricas, o que um dia poderá permitir que robôs apoiem pessoas em situações cotidianas e em ambientes imprevisíveis e em constante mudança.
- O modelo de comportamento robótico do TRI combina demonstrações táteis do instrutor com descrições em linguagem natural sobre o objetivo, e usa a Diffusion Policy baseada em IA para aprender a habilidade demonstrada.
- O TRI desenvolveu a Diffusion Policy em colaboração com o grupo do professor Song, da Columbia University, como uma poderosa abordagem de IA generativa para o aprendizado de comportamentos.
- A plataforma robótica do TRI foi construída sob medida para tarefas de manipulação bimanual com destreza, permitindo feedback háptico e percepção tátil.
- O TRI usa o Drake, um projeto baseado em modelos para design de robôs, que fornece um conjunto de ferramentas de ponta e uma plataforma de simulação para ampliar e acelerar ainda mais o desenvolvimento em simulação e no mundo real.
- A segurança é central nos esforços de desenvolvimento robótico do TRI, e o sistema inclui proteções robustas projetadas para respeitar garantias de segurança, como evitar que o robô colida consigo mesmo ou com o ambiente.
- Informações mais técnicas sobre esse avanço do TRI podem ser encontradas no blog da empresa no Medium, e o tema será discutido em uma sessão de perguntas e respostas ao vivo no LinkedIn em 4 de outubro.
1 comentários
Comentários do Hacker News
Underactuated Robotics, é recomendado para entender a complexidade da robótica.