Alcançado tênis de mesa robótico competitivo em nível humano
(sites.google.com)- A equipe da DeepMind anunciou que um agente robótico de tênis de mesa alcançou desempenho de jogo no nível de humanos amadores usando uma estrutura de políticas hierárquica e técnicas de adaptação em tempo real.
- Esse robô foi validado por meio de transferência simulação-para-real em zero-shot (sim-to-real), adaptação em jogo real e testes de partidas contra humanos reais.
- Como resultado, obteve taxa de vitória de 100% contra iniciantes e 55% contra jogadores intermediários, comprovando um desempenho claramente em nível humano intermediário.
1. Contexto da pesquisa e contribuições
-
O tênis de mesa é um esporte complexo que exige ao mesmo tempo estratégia e controle motor em alta velocidade, oferecendo aos robôs um desafio em nível humano.
-
Pesquisas anteriores ficavam restritas à execução de ralis simples, e este estudo é o primeiro a realizar jogo competitivo real contra humanos.
-
As contribuições deste estudo são as seguintes:
- Estrutura de políticas hierárquica (HLC + LLC)
- Técnica de transferência sim-to-real em zero-shot
- Sistema de adaptação ao oponente em tempo real
- Experimento de avaliação com usuários por meio de 29 jogadores humanos reais
2. Estrutura do sistema e método de treinamento
- O controlador inferior (LLC) possui políticas especializadas em técnicas específicas (forehand, backhand, saque etc.) e descritores de habilidade (
skill descriptor). - O controlador superior (HLC) seleciona a técnica apropriada considerando a situação da partida, as estatísticas do oponente e as características de cada LLC.
- O processo de treinamento avança na sequência dados humanos iniciais → simulação → aplicação em jogo real → aprendizado iterativo, formando assim uma estrutura automática de aprendizado por currículo.
3. Avaliação de desempenho e análise de limitações
-
Partidas contra um total de 29 jogadores humanos de diferentes níveis:
- Iniciantes: 100% de vitórias
- Intermediários: 55% de vitórias
- Avançados ou acima: nenhuma vitória
→ Taxa geral de vitória: 45% (por partida), 46% (por set)
-
Na avaliação qualitativa, os participantes disseram que era “divertido e imersivo”, e jogaram voluntariamente mais de 4 dos 5 minutos em média.
-
Pontos fracos:
- Dificuldade para lidar com underspin
- Dificuldade para responder a bolas baixas
→ Isso se deve à dificuldade de evitar colisões com a mesa de tênis de mesa e de estimar o spin, o que fica como tarefa de melhoria futura
Ainda não há comentários.