7 pontos por kimchi 27 일 전 | 4 comentários | Compartilhar no WhatsApp

Acoplei um LLM ao Nemotron-Personas-Korea e rodei uma simulação para governadores e prefeitos das eleições locais de 2026.

Fiz scraping de 8.300 candidatos no NEC → amostragem de 5.100 personas, 300 por província/cidade → simulação de 4.800 votos com Gemma 4 e4b (RTX 5060, 3 horas).

Resultados

Prefeito de Daegu: Kim Han-gu (independente) 90,5% / Lee Jae-man (PPP) 8,2% / Kim Boo-kyum (Democrata) 1,4%

Ex-primeiro-ministro + 4 mandatos + natural de Daegu e ainda assim 1,4%. O LLM foi atraído pelo rótulo de "trabalhador" da persona e concentrou os votos no candidato independente trabalhador.

Padrões gerais:

  • Superestimação do prêmio do incumbente (Gangwon Kim Jin-tae 100%, Gyeongbuk Lee Cheol-woo 99%)
  • Correspondência simplista por rótulo de profissão
  • Explosão de abstenção quando faltam informações (Chungbuk 73%, Incheon 93%)

Conclusão

Simulações de personas com LLM não servem como substituto para pesquisas de opinião. Fica quantitativamente confirmado que os estudos americanos de LLM-as-voter não se aplicam diretamente à política coreana.

4 comentários

 
calmlake79 26 일 전

Sou o criador do "ManyPerson" que está em "Artigos recomendados para ler junto".
Como você disse, a simulação de personas com LLM não é um substituto para pesquisas de opinião, mas um "complemento".
Claro, quanto mais precisão houver nas personas e quanto mais informações de contexto forem incluídas, mais os resultados podem se aproximar dos valores reais, mas, basicamente, eu também desenvolvi o serviço pensando nele mais como um complemento do que como um substituto.
Mesmo assim, acho que ele tem valor suficiente.

 
kimchi 26 일 전

Concordo!!

 
calmlake79 26 일 전

Agora que vi, antes eu estava meio sem foco e acabei deixando a resposta pela metade;;

Antes de tudo, uma das coisas que considero valiosas nas respostas de personas de IA é...
que elas podem oferecer ao usuário ou ao autor uma visão mais ampla, e acho que esse é o ponto principal.

Eu mesmo senti isso ao criar esse serviço: antes de tudo, minha forma de enxergar o mundo e os acontecimentos realmente ficou mais ampla.
De "por que pensam isso desse jeito?" para "ah, então também dá para receber e entender um acontecimento desse jeito..."
Acho que isso ajuda a olhar as coisas de forma mais abrangente.
No caso de eleições, que você mencionou, acredito que seja a mesma coisa.

Acabei de rodar um teste com Daegu como alvo, e realmente saiu algo meio distante da realidade.

manyperson Link

Também fizemos testes parecidos no nosso serviço e, assim, os resultados não saem exatamente... do jeito que eu imagino, mas ainda assim dá para ver perspectivas diversas. ( Claro, por causa da atualização de informações recentes, ainda não fica tão preciso, mas acho que isso é algo que podemos ir cobrindo tecnicamente aos poucos. )

Na verdade, no nosso próprio serviço, durante os testes, eu também ficava rodando para ver o que as pessoas pensariam... e foi bem positivo, mas na prática ainda não sei ao certo ^^;;

 
kimchi 26 일 전

Como os LLMs fazem inferência em unidades de tokens de texto, quando aparece um rótulo de alta frequência, parece que os padrões que surgiam junto com esse rótulo durante o treinamento são ativados e tendem a sobrepor outras informações.

Além disso, mesmo que uma persona tenha rótulos detalhados, o comportamento de voto dessa pessoa não é determinado por uma função que o LLM consiga inferir; o que de fato define o comportamento político real é influenciado demais por informações que não existem numa persona sintetizada, como histórico de votos anterior, partido apoiado por familiares e colegas, notícias vistas recentemente e simpatia pessoal pelo candidato.
Isso parece atuar ao mesmo tempo também na inferência de todas as situações e fenômenos econômicos/políticos (específicos).