Eureka, agente de IA da Nvidia, torna possível ensinar habilidades complexas a robôs

xguru · 2023-10-25T10:35:02+09:00

O Eureka usa um algoritmo de recompensa (código de software) gerado automaticamente com LLMs (GPT-4) para treinar robôs a executar tarefas complexas Treinou uma mão robótica na habilidade de "girar uma caneta", semelhante ao que uma pessoa faz Além disso, o Eureka ensina robôs a abrir gavetas e armários, lançar e pegar bolas e manipular tesouras Não são necessários prompts específicos por tarefa nem templates de recompensa predefinidos, e o feedback humano pode ser integrado com facilidade

(blogs.nvidia.com)

5 pontos por xguru 2023-10-25 | Ainda não há comentários. | Compartilhar no WhatsApp

O Eureka usa um algoritmo de recompensa (código de software) gerado automaticamente com LLMs (GPT-4) para treinar robôs a executar tarefas complexas
Treinou uma mão robótica na habilidade de "girar uma caneta", semelhante ao que uma pessoa faz
Além disso, o Eureka ensina robôs a abrir gavetas e armários, lançar e pegar bolas e manipular tesouras
Não são necessários prompts específicos por tarefa nem templates de recompensa predefinidos, e o feedback humano pode ser integrado com facilidade

Eureka, agente de IA da Nvidia, torna possível ensinar habilidades complexas a robôs

Leituras relacionadas

Ainda não há comentários.