Além do A*: melhor planejamento com transformadores
- Os modelos de transformador alcançaram grandes avanços em diversas áreas de aplicação, mas ainda ficam atrás dos métodos tradicionais de planejamento simbólico para resolver tarefas complexas de tomada de decisão.
- Os pesquisadores apresentam uma forma de treinar transformadores para resolver tarefas complexas de planejamento e desenvolveram o modelo Searchformer, que resolve de forma ótima quebra-cabeças Sokoban nunca vistos antes em 93,7% das vezes, usando até 26,8% menos etapas de busca do que a busca A* convencional.
- O Searchformer é um modelo transformador encoder-decoder treinado para prever o comportamento da busca A*, e ajustado por meio de expert iteration para gerar planos ótimos com menos etapas de busca do que a busca A*.
Método de treinamento e desempenho
- No método de treinamento, o comportamento de busca do A* é representado como uma sequência de tokens que indica os momentos em que estados são adicionados e removidos da árvore de busca durante o planejamento simbólico.
- Em um estudo de ablação sobre navegação em labirintos, o Searchformer supera com folga um modelo de referência que prevê diretamente planos ótimos, mesmo sendo de 5 a 10 vezes menor e treinado com um conjunto de dados 10 vezes menor.
- Os pesquisadores mostram que o Searchformer é eficaz em tarefas de tomada de decisão maiores e mais complexas, como Sokoban, tanto na taxa de problemas resolvidos quanto na redução do comportamento de busca.
Opinião do GN⁺
- Este estudo mostra novas possibilidades de uso para modelos de transformador na área de inteligência artificial. Ao propor uma abordagem mais eficiente do que os métodos simbólicos tradicionais para resolver tarefas complexas de tomada de decisão, representa um avanço importante na ampliação do campo de aplicação da IA.
- O modelo Searchformer demonstra capacidade de resolver problemas de forma mais rápida e eficiente usando menos recursos. Isso pode ser uma grande vantagem, especialmente na implementação de IA em ambientes com recursos limitados.
- O estudo também sugere que o avanço da tecnologia de IA não depende apenas de mais dados e modelos maiores, mas pode acontecer por meio de metodologias mais inteligentes e melhorias algorítmicas. Trata-se de uma abordagem bastante interessante e útil do ponto de vista da sustentabilidade e da eficiência da pesquisa em IA.
1 comentários
Comentários do Hacker News