Os limites do Leela Chess Zero
- O Leela Chess Zero se tornou campeão mundial após passar por dezenas de bilhões de rodadas de treinamento por autojogo
- Mas foi completamente derrotado pelo Stockfish
- Mesmo treinando uma rede maior, não conseguiu vencer o Stockfish
- O Stockfish usava um modelo muito menor que o Leela, mas venceu graças a uma capacidade de busca superior
Mais reflexões sobre a vitória do Stockfish
- O Leela perdeu o posto de campeão mundial por não ser bom em busca
- A adição de capacidade de busca aos LLMs está próxima, mas não está recebendo atenção
- Modelos fundacionais como o GPT-4 não têm capacidade de busca
- Predomina a suposição de que seriam necessários modelos maiores para viabilizar a busca, mas existem contraexemplos
- Segundo pesquisas da DeepMind, o comportamento de busca emerge naturalmente em algoritmos de xadrez
- Como já existem algoritmos de busca eficientes, não há necessidade de esperar que uma busca preliminar ineficiente surja por acaso em modelos grandes
- Os modelos atuais já são grandes o suficiente para possibilitar a busca, e talvez sejam até maiores do que o necessário
A busca permite alocar recursos computacionais ao domínio-alvo
- Suponha que uma empresa farmacêutica queira usar IA para pesquisar novos medicamentos
- Em um mundo com busca em IA, há duas opções
- esperar até 2030 para que a OpenAI lance um modelo 4 ordens de magnitude maior, ou
- usar hoje mesmo 4 ordens de magnitude a mais de computação de inferência
- A empresa farmacêutica provavelmente preferirá a segunda opção
- Por meio da busca, seria possível aproveitar agora capacidades de nível ASI de 2030
Cenário de avanço da IA baseada em busca
- Descobre-se que a busca funciona nos modelos atuais
- Governos ou grandes laboratórios percebem que podem aplicar imediatamente a busca à pesquisa em IA ou à coleta de informações no exterior
- Como a computação de inferência é limitada, seu uso fica restrito a governos ou grandes laboratórios, em segurança ou pesquisa em IA
- O avanço da IA guiado por busca leva à descoberta de algoritmos de exploração mais eficientes e de arquiteturas de modelo melhores
- A busca não exige mais dados de treinamento, resolvendo o problema da “barreira de dados”
- A explosão de inteligência começa no ano que vem, e não em 2030
Possibilidade de aplicar busca à própria pesquisa em IA
- Se a IA avançar o suficiente para conseguir pesquisar a si mesma, espera-se uma dinâmica de avanço acelerado
- Assim como uma empresa farmacêutica pode pesquisar novos medicamentos sem esperar pelo GPT-8, laboratórios de IA também poderão pesquisar IA sem esperar por modelos maiores
- Para substituir pesquisadores humanos de IA, talvez sejam necessárias mais remoções de limitações
- Ainda assim, espera-se que até um chatbot simples com inteligência de nível GPT-8 seja suficiente para acelerar o avanço da IA
1 comentários
Opiniões do Hacker News
Resumo dos comentários do Hacker News