A primeira IA de política geral de Physical Intelligence torna possível dobrar roupas
(physicalintelligence.company)-
Inteligência física (π) π0: nossa primeira política geral
-
Estamos vivendo na era da revolução da IA, e a IA consegue resolver problemas “fáceis”, como vencer uma partida de xadrez ou descobrir novos medicamentos, mas problemas do mundo físico, como dobrar uma camisa ou arrumar uma mesa, ainda continuam difíceis. Para resolver isso, é preciso fazer com que sistemas de IA tenham inteligência física.
-
Nos últimos 8 meses, desenvolvemos o π0, um modelo fundamental de robótica de uso geral, que é o primeiro passo para criar uma inteligência artificial à qual os usuários possam pedir que faça tarefas desejadas em robôs. O π0 abrange imagens, texto e ações, e adquire inteligência física por meio da experiência do robô.
-
A promessa de uma política robótica geral
-
Hoje, os robôs têm especialização restrita e não conseguem agir em ambientes complexos. A IA pode simplificar a programação de novos comportamentos ao permitir que os robôs aprendam e sigam instruções dos usuários. Para isso, é necessário muito dado.
-
Se for possível treinar uma política robótica geral, será possível criar um modelo capaz de executar diversas habilidades e controlar diferentes robôs. Esse modelo poderá se especializar em novas tarefas com uma pequena quantidade de dados.
-
Mistura de treinamento entre implementações
-
O π0 foi treinado usando pré-treinamento visão-linguagem em escala de internet, conjuntos de dados open source de manipulação robótica e um conjunto de dados de tarefas sofisticadas em 8 robôs diferentes. Ele pode realizar várias tarefas, seja por prompts zero-shot ou por ajuste fino.
-
Herdando compreensão semântica em escala de internet
-
O π0 herda conhecimento semântico e compreensão visual de um modelo de visão-linguagem (VLM) pré-treinado em escala de internet. O VLM é treinado para modelar textos e imagens da web.
-
Pós-treinamento para manipulação sofisticada
-
Tarefas complexas e sofisticadas podem ser especializadas com ajuste fino do modelo. Por exemplo, dobrar roupa para lavar é uma tarefa extremamente difícil.
-
Avaliação e comparação do π0
-
Em comparação com outros modelos fundamentais de robótica, o π0 apresentou desempenho superior em todas as tarefas. Mesmo em comparação com o π0-small, mostrou desempenho melhor.
-
Direções futuras
-
O objetivo da Physical Intelligence é desenvolver um modelo fundamental capaz de controlar todos os robôs. Os experimentos até agora mostram que ele pode controlar diversos robôs e realizar tarefas nas quais antes não havia sucesso. No entanto, a política robótica geral ainda está em estágio inicial, e muitos avanços ainda serão necessários.
1 comentários
Comentários do Hacker News
Menciona-se a necessidade de robôs domésticos para a satisfação humana
Visão cética sobre a utilidade prática dos robôs
Problema das limitações de espaço em cidades europeias
Possibilidade dos robôs como ferramentas de automação de laboratório
Potencial dos robôs de cozinha
Questões de simplicidade e custo dos robôs
Mudanças na lavanderia
Problema da velocidade dos robôs