2 pontos por baeba 2025-05-07 | Ainda não há comentários. | Compartilhar no WhatsApp
  1. A equipe da DeepMind anunciou que um agente robótico de tênis de mesa alcançou desempenho de jogo no nível de humanos amadores usando uma estrutura de políticas hierárquica e técnicas de adaptação em tempo real.
  2. Esse robô foi validado por meio de transferência simulação-para-real em zero-shot (sim-to-real), adaptação em jogo real e testes de partidas contra humanos reais.
  3. Como resultado, obteve taxa de vitória de 100% contra iniciantes e 55% contra jogadores intermediários, comprovando um desempenho claramente em nível humano intermediário.

1. Contexto da pesquisa e contribuições

  • O tênis de mesa é um esporte complexo que exige ao mesmo tempo estratégia e controle motor em alta velocidade, oferecendo aos robôs um desafio em nível humano.

  • Pesquisas anteriores ficavam restritas à execução de ralis simples, e este estudo é o primeiro a realizar jogo competitivo real contra humanos.

  • As contribuições deste estudo são as seguintes:

    • Estrutura de políticas hierárquica (HLC + LLC)
    • Técnica de transferência sim-to-real em zero-shot
    • Sistema de adaptação ao oponente em tempo real
    • Experimento de avaliação com usuários por meio de 29 jogadores humanos reais

2. Estrutura do sistema e método de treinamento

  • O controlador inferior (LLC) possui políticas especializadas em técnicas específicas (forehand, backhand, saque etc.) e descritores de habilidade (skill descriptor).
  • O controlador superior (HLC) seleciona a técnica apropriada considerando a situação da partida, as estatísticas do oponente e as características de cada LLC.
  • O processo de treinamento avança na sequência dados humanos iniciais → simulação → aplicação em jogo real → aprendizado iterativo, formando assim uma estrutura automática de aprendizado por currículo.

3. Avaliação de desempenho e análise de limitações

  • Partidas contra um total de 29 jogadores humanos de diferentes níveis:

    • Iniciantes: 100% de vitórias
    • Intermediários: 55% de vitórias
    • Avançados ou acima: nenhuma vitória
      → Taxa geral de vitória: 45% (por partida), 46% (por set)
  • Na avaliação qualitativa, os participantes disseram que era “divertido e imersivo”, e jogaram voluntariamente mais de 4 dos 5 minutos em média.

  • Pontos fracos:

    • Dificuldade para lidar com underspin
    • Dificuldade para responder a bolas baixas
      → Isso se deve à dificuldade de evitar colisões com a mesa de tênis de mesa e de estimar o spin, o que fica como tarefa de melhoria futura

Ainda não há comentários.

Ainda não há comentários.