- A Meta AI desenvolveu e lançou uma inteligência artificial que demonstra capacidade em nível humano no famoso jogo de tabuleiro estratégico Diplomacy
- Na versão online do jogo, alcançou o top 10% com uma pontuação mais de 2 vezes superior à de humanos
- Diplomacy era, há décadas, um desafio considerado impossível para a IA
- No jogo, é preciso entender as motivações e perspectivas das outras pessoas para criar planos complexos e ajustar estratégias
- E também se comunicar com elas em linguagem natural para chegar a acordos e transmitir confiança sobre parcerias e alianças
- O CICERO negocia tão bem que às vezes foi até preferido em relação a outros participantes humanos
- Se não perceber quando os outros estão blefando ou não entender comportamentos agressivos, perde rapidamente
- Além disso, se não falar como uma pessoa real — demonstrando empatia, construindo relações e falando sobre conhecimento do jogo — os outros não vão querer jogar junto
- O centro dessa conquista foi o desenvolvimento de novas técnicas na interseção de duas áreas completamente diferentes da IA
- o raciocínio estratégico (Strategic Reasoning) usado em sistemas como AlphaGo e Pluribus
- o processamento de linguagem natural (NLP) usado em sistemas como GPT-3, BlenderBot 3, LaMDA e OPT-175B
- Por exemplo, o CICERO pode inferir que precisará do apoio de um jogador específico no fim da partida e então elaborar uma estratégia para conquistar a boa vontade dessa pessoa
- O código e o artigo também foram publicados
1 comentários
Diplomacy é um jogo de tabuleiro lançado em 1959, e em 2008 chegou a ganhar até uma edição comemorativa de 50 anos. No jogo, cada jogador assume um dos 7 países da Europa no período anterior à Primeira Guerra Mundial (Reino Unido, França, Áustria-Hungria, Alemanha, Itália, Rússia e Turquia). A partida começa na primavera de 1901, e a cada ano são realizadas ações nos turnos de primavera e outono. Existem apenas dois tipos de unidades, exército e frota, e elas podem escolher entre mover-se para regiões adjacentes (incluindo ataque), apoiar aliados em regiões vizinhas no ataque ou na defesa, ou manter a posição atual. Todas as unidades têm força de ataque 1 e movimento 1. Claro, exércitos só podem se deslocar por terra, e é possível fazer transporte marítimo (Convoy) por meio de frotas. Ou seja, há exatamente 4 ações: Hold/Move/Support/Convoy
No mapa que cobre toda a Europa, há ao todo 34 centros de suprimento (Supply Center) marcados com estrelas, e vence quem controlar 18 deles. Todos os países começam com 3 centros de suprimento, exceto a Rússia, que começa com 4. Por isso, no início 12 estão vazios. Ao final do turno de outono, cada país pode manter um número de unidades igual à quantidade de centros de suprimento que possui. As forças iniciais variam por país, com combinações como 2 exércitos e 1 frota, ou 2 frotas e 1 exército. O Reino Unido, com supremacia naval, começa com frotas em Londres e Edimburgo e um exército em Liverpool; a França começa com exércitos em Paris e Marselha e uma frota em Brest. Já a Rússia começa com exércitos em Moscou e Varsóvia, e frotas em Sebastopol e São Petersburgo. As regiões se dividem em 3 tipos: interior, mar e costa. Regiões interiores só podem ser ocupadas por exércitos, regiões marítimas apenas por frotas, e regiões costeiras podem ser ocupadas por exércitos ou frotas.
O andamento do jogo em si é muito simples. Não há dados nem qualquer outro elemento de sorte; a cada turno, cada jogador precisa obter a ajuda dos países vizinhos por meio de negociações diplomáticas para favorecer o deslocamento de seus exércitos. A diplomacia pode acontecer de forma pública ou secreta. Como costuma ser jogado de forma assíncrona, às vezes há limite de tempo. Depois disso, cada um envia uma "folha de ordens" com as ações de suas unidades, e o mestre reúne tudo e processa o resultado. Por isso, também é possível jogar no formato Play By Mail, trocando mensagens por e-mail. É como se todos enviassem suas ordens e elas fossem reveladas ao mesmo tempo. Em cada folha de ordens, cada unidade pode receber apenas 1 ordem. Por exemplo, se a França tem 3 unidades, a folha de ordens seria algo como
A Par–Bur, A Mar–Spa, F Bre–Pic. Ou seja: "mover o exército de Paris para Borgonha / mover o exército de Marselha para Espanha / mover a frota de Brest para Picardia"Isso é feito assim porque todas as unidades têm a mesma força, 1, mas cada região pode conter apenas 1 unidade (exército). Então, se 2 unidades tentarem se mover para a mesma região, a ação é anulada. O que resolve isso é o apoio (Support) de forças aliadas em regiões vizinhas. Se, com apoio, o número de unidades atacantes ficar maior que o de unidades defensoras, a região é conquistada. Portanto, para conseguir o que quer, é preciso negociar bastante.
"Estou pensando em atacar a Ucrânia desta vez, você não quer me ajudar? Vamos avançar juntos para o oeste"
"Nem pensar!" / "E o que eu ganho com isso?"
Na prática, é um jogo em que tudo, do começo ao fim, se resume a "interações diplomáticas conduzidas por conversa", então é impressionante que uma IA consiga jogar isso direito.