2 pontos por GN⁺ 2024-10-19 | 1 comentários | Compartilhar no WhatsApp

Sem algoritmos de nível de grande mestre de xadrez

  • Este repositório fornece uma implementação do artigo "Sem algoritmos de nível de grande mestre de xadrez"
  • O sucesso recente do machine learning se deve principalmente a arquiteturas baseadas em atenção em larga escala e a conjuntos de dados de escala sem precedentes
  • Este artigo investiga o impacto do treinamento em larga escala para xadrez
  • Diferentemente dos motores de xadrez tradicionais, ele não depende de heurísticas complexas nem de busca explícita
  • Um modelo Transformer com 270 milhões de parâmetros foi treinado de forma supervisionada em um conjunto de dados de 10 milhões de partidas de xadrez
  • Cada tabuleiro foi anotado usando os valores de ação do motor Stockfish 16, gerando cerca de 15 bilhões de pontos de dados
  • O maior modelo registrou Elo 2895 em blitz no Lichess contra humanos e resolveu problemas difíceis de xadrez sem algoritmo de busca explícita
  • Supera as redes de política e valor do AlphaZero (sem busca) e o GPT-3.5-turbo-instruct
  • Uma investigação sistemática sobre o tamanho do modelo e do conjunto de dados mostra que um desempenho forte em xadrez só surge em escala suficiente
  • Foram realizados experimentos extensivos sobre escolhas de design e hiperparâmetros para validar os resultados

Resumo do GN⁺

  • Este projeto é uma pesquisa importante que mostra ser possível alcançar alto desempenho no xadrez sem algoritmos tradicionais de busca
  • Explora novas possibilidades para motores de xadrez ao usar grandes conjuntos de dados e modelos Transformer
  • Mostra desempenho superior em comparação com motores de xadrez já fortes, como o AlphaZero
  • Oferece informações interessantes e úteis para quem se interessa por xadrez e sugere novas possibilidades de aplicação para machine learning
  • Projetos com funcionalidades semelhantes incluem AlphaZero e Leela Chess Zero

1 comentários

 
GN⁺ 2024-10-19
Comentários do Hacker News
  • É difícil encontrar um oponente de xadrez no nível que o usuário deseja. A maioria dos motores reduz a profundidade de busca para baixar a dificuldade, mas isso não é eficaz

    • Os usuários querem um oponente de computador que pareça um jogador humano
  • Um usuário fez uma apresentação sobre destilação de conhecimento relacionada a xadrez, explicando como destilar funções complexas de busca não linear em um modelo transformer quase linear para entradas padronizadas como as do xadrez

  • Para quem tem interesse em redes neurais de xadrez, é recomendado um repositório no GitHub com código simples em PyTorch e uma arquitetura semelhante à das redes neurais de xadrez com melhor desempenho atualmente

  • Há um post de blog comparando a rede LC0 com a rede transformer da DeepMind

  • O artigo "Grandmaster-Level Chess Without Search" destaca a importância de arquiteturas e conjuntos de dados baseados em atenção em larga escala, usando um modelo transformer de 270M de parâmetros para aprender xadrez

    • Mais de 1 bilhão de pontos de dados foram gerados usando o motor Stockfish 16, e o modelo alcançou 2895 de Elo blitz no Lichess contra humanos
    • Supera as redes de política e valor do AlphaZero
  • O grande conjunto de dados sintéticos foi gerado usando busca tradicional, o que equivale a codificar a árvore de busca no modelo transformer

  • Matthew Sadler configurou o Leela Zero para jogar de forma intuitiva, e isso executa partidas de treinamento de maneira eficaz mesmo sem busca

  • Resolver o xadrez gera uma árvore grande demais, e há duas abordagens para otimizá-la

    • Aproximar a árvore e aproximar as anotações
    • É possível aproximar a árvore com dados de 270M de palavras
  • O estado do tabuleiro é codificado convertendo strings FEN em strings de comprimento fixo, e as ações são armazenadas usando a notação UCI

    • Se for preciso reescrever o tokenizador para cada variação do problema, isso é apenas programação