RoboCat - agente robótico com autoaperfeiçoamento

kuroneko · 2023-06-21T10:24:42+09:00

O Google DeepMind apresentou o RoboCat, que aprende por conta própria ao realizar várias tarefas com um braço robótico. Ele é baseado no Gato ("gato", em espanhol), um modelo multimodal que pode operar tanto em ambientes reais quanto em ambientes de simulação. Para se autoaperfeiçoar, primeiro coleta dados reais sobre novas tarefas. Com base nos dados reais, ajusta finamente o modelo base para criar um agente derivado. O novo agente pratica cerca de 10 mil vezes para produzir um conjunto de dados de treinamento. Os dados reais e os dados gerados por ele próprio são integrados ao conjunto de treinamento do RoboCat. Uma nova versão do RoboCat é treinada. Com isso, ele consegue se adaptar em poucas horas a novos braços robóticos com mais articulações ou mais pinças. Além disso, cria-se um ciclo virtuoso de treinamento: o modelo inicial, que mostrava taxa de sucesso de 36% em uma tarefa específica, mais que dobrou esse resultado e chegou a 74%.

(deepmind.com)

10 pontos por kuroneko 2023-06-21 | 3 comentários | Compartilhar no WhatsApp

O Google DeepMind apresentou o RoboCat, que aprende por conta própria ao realizar várias tarefas com um braço robótico.
Ele é baseado no Gato ("gato", em espanhol), um modelo multimodal que pode operar tanto em ambientes reais quanto em ambientes de simulação.
- Para se autoaperfeiçoar, primeiro coleta dados reais sobre novas tarefas.
- Com base nos dados reais, ajusta finamente o modelo base para criar um agente derivado.
- O novo agente pratica cerca de 10 mil vezes para produzir um conjunto de dados de treinamento.
- Os dados reais e os dados gerados por ele próprio são integrados ao conjunto de treinamento do RoboCat.
- Uma nova versão do RoboCat é treinada.
Com isso, ele consegue se adaptar em poucas horas a novos braços robóticos com mais articulações ou mais pinças.
Além disso, cria-se um ciclo virtuoso de treinamento: o modelo inicial, que mostrava taxa de sucesso de 36% em uma tarefa específica, mais que dobrou esse resultado e chegou a 74%.

3 comentários

nicewook 2023-06-21

Finalmente está se abrindo um espaço para a inteligência artificial encontrar e vivenciar o mundo real.

kuroneko 2023-06-21

Os comentários da thread no HN estão engraçadíssimos.
Eu também pensei exatamente a mesma coisa: só eu estava esperando um gato robô? Fiquei meio decepcionado...

Seria legal se pelo menos colocassem um adesivo de gato no braço robótico.

kuroneko 2023-06-21

Ao resumir o artigo, o resultado é o seguinte.

RoboCat é um agente com base em autoaperfeiçoamento para manipulação robótica. Ele é treinado com um dataset amplo e diversificado de tarefas robóticas usando múltiplas simulações e braços robóticos reais.

Os principais objetivos do RoboCat são os seguintes.

Generalizar para novas tarefas e novos robôs com o mínimo de dados. O RoboCat consegue se adaptar a novas tarefas e robôs usando apenas de 100 a 1000 exemplos de demonstração.
Autoaperfeiçoar-se por meio de um processo iterativo. O modelo RoboCat ajustado é usado para gerar mais dados de treinamento, e esses dados são adicionados ao conjunto de treinamento para melhorar o agente geral.
Lidar com múltiplas implementações com tarefas e espaços de observação diferentes. O RoboCat é testado em braços com até 14 graus de liberdade e diferentes garras.
Resolver diversas tarefas de manipulação hábil com objetos de diferentes formas, tamanhos e texturas. As tarefas incluem empilhar, inserir, levantar e outras.

Os principais resultados são os seguintes.

À medida que os dados de treinamento do RoboCat aumentam e se tornam mais diversos, a transferência entre tarefas melhora, e a adaptação a novas tarefas se torna mais eficiente.
O RoboCat consegue se adaptar com sucesso a novas tarefas e novos robôs usando apenas uma pequena quantidade de dados de demonstração e, em comparação com os baselines, exige menos esforço de aprendizado.
Ao expandir os dados de treinamento por meio do autoaperfeiçoamento, o RoboCat apresenta melhor desempenho nas tarefas de treinamento originais e é refinado com mais eficácia.

Em resumo, o RoboCat, um agente com base em autoaperfeiçoamento para manipulação robótica treinado com um dataset amplo e diversificado, mostra que pode generalizar para novas tarefas e novos robôs com o mínimo de dados por meio de ajuste fino e autoaperfeiçoamento. Sua capacidade de aproveitar, em larga escala, experiências robóticas heterogêneas tem potencial para transformar o aprendizado robótico.

RoboCat - agente robótico com autoaperfeiçoamento

Leituras relacionadas

3 comentários