Sem algoritmos de nível de grande mestre de xadrez
- Este repositório fornece uma implementação do artigo "Sem algoritmos de nível de grande mestre de xadrez"
- O sucesso recente do machine learning se deve principalmente a arquiteturas baseadas em atenção em larga escala e a conjuntos de dados de escala sem precedentes
- Este artigo investiga o impacto do treinamento em larga escala para xadrez
- Diferentemente dos motores de xadrez tradicionais, ele não depende de heurísticas complexas nem de busca explícita
- Um modelo Transformer com 270 milhões de parâmetros foi treinado de forma supervisionada em um conjunto de dados de 10 milhões de partidas de xadrez
- Cada tabuleiro foi anotado usando os valores de ação do motor Stockfish 16, gerando cerca de 15 bilhões de pontos de dados
- O maior modelo registrou Elo 2895 em blitz no Lichess contra humanos e resolveu problemas difíceis de xadrez sem algoritmo de busca explícita
- Supera as redes de política e valor do AlphaZero (sem busca) e o GPT-3.5-turbo-instruct
- Uma investigação sistemática sobre o tamanho do modelo e do conjunto de dados mostra que um desempenho forte em xadrez só surge em escala suficiente
- Foram realizados experimentos extensivos sobre escolhas de design e hiperparâmetros para validar os resultados
Resumo do GN⁺
- Este projeto é uma pesquisa importante que mostra ser possível alcançar alto desempenho no xadrez sem algoritmos tradicionais de busca
- Explora novas possibilidades para motores de xadrez ao usar grandes conjuntos de dados e modelos Transformer
- Mostra desempenho superior em comparação com motores de xadrez já fortes, como o AlphaZero
- Oferece informações interessantes e úteis para quem se interessa por xadrez e sugere novas possibilidades de aplicação para machine learning
- Projetos com funcionalidades semelhantes incluem AlphaZero e Leela Chess Zero
1 comentários
Comentários do Hacker News
É difícil encontrar um oponente de xadrez no nível que o usuário deseja. A maioria dos motores reduz a profundidade de busca para baixar a dificuldade, mas isso não é eficaz
Um usuário fez uma apresentação sobre destilação de conhecimento relacionada a xadrez, explicando como destilar funções complexas de busca não linear em um modelo transformer quase linear para entradas padronizadas como as do xadrez
Para quem tem interesse em redes neurais de xadrez, é recomendado um repositório no GitHub com código simples em PyTorch e uma arquitetura semelhante à das redes neurais de xadrez com melhor desempenho atualmente
Há um post de blog comparando a rede LC0 com a rede transformer da DeepMind
O artigo "Grandmaster-Level Chess Without Search" destaca a importância de arquiteturas e conjuntos de dados baseados em atenção em larga escala, usando um modelo transformer de 270M de parâmetros para aprender xadrez
O grande conjunto de dados sintéticos foi gerado usando busca tradicional, o que equivale a codificar a árvore de busca no modelo transformer
Matthew Sadler configurou o Leela Zero para jogar de forma intuitiva, e isso executa partidas de treinamento de maneira eficaz mesmo sem busca
Resolver o xadrez gera uma árvore grande demais, e há duas abordagens para otimizá-la
O estado do tabuleiro é codificado convertendo strings FEN em strings de comprimento fixo, e as ações são armazenadas usando a notação UCI