5 pontos por xguru 2023-10-25 | Ainda não há comentários. | Compartilhar no WhatsApp
  • O Eureka usa um algoritmo de recompensa (código de software) gerado automaticamente com LLMs (GPT-4) para treinar robôs a executar tarefas complexas
  • Treinou uma mão robótica na habilidade de "girar uma caneta", semelhante ao que uma pessoa faz
  • Além disso, o Eureka ensina robôs a abrir gavetas e armários, lançar e pegar bolas e manipular tesouras
  • Não são necessários prompts específicos por tarefa nem templates de recompensa predefinidos, e o feedback humano pode ser integrado com facilidade

Ainda não há comentários.

Ainda não há comentários.