7 pontos por GN⁺ 2025-10-27 | 1 comentários | Compartilhar no WhatsApp
  • Na pesquisa em inteligência artificial, a ausência de uma definição clara de AGI (Artificial General Intelligence) vem obscurecendo a lacuna entre a cognição em nível humano e a IA atual
  • Este artigo propõe um framework quantificável para definir AGI como “uma IA com a diversidade cognitiva e a proficiência de um adulto bem instruído”
  • Com base na teoria Cattell-Horn-Carroll (CHC), um modelo de referência no estudo da cognição humana, a inteligência geral humana é decomposta em 10 domínios cognitivos centrais e aplicada à avaliação de IA
  • Por meio desse framework, os perfis cognitivos de GPT-4 e GPT-5 foram quantificados; o GPT-4 registrou 27% e o GPT-5, 57% de pontuação AGI
  • Isso mostra o rápido avanço da IA, mas também sugere que ainda existe uma grande distância até alcançar AGI devido à falta de capacidades cognitivas fundamentais, como o armazenamento de memória de longo prazo

A necessidade de definir AGI e o problema percebido

  • AGI (Artificial General Intelligence) é considerada um dos avanços tecnológicos mais importantes da história da humanidade, mas sua definição ambígua gera debates
    • À medida que a IA passa a dominar gradualmente áreas como matemática e arte, antes vistas como dependentes da inteligência humana, ocorre o fenômeno de deslocamento contínuo do critério do que seria “AGI”
    • Com isso, as discussões sobre quando AGI será alcançada ou em que nível se encontra acabam se tornando pouco produtivas, enquanto a distância real entre a IA atual e a AGI fica encoberta
  • Para eliminar essa ambiguidade, o artigo apresenta um framework quantitativo e sistemático
    • Definição proposta: “AGI é uma IA com a diversidade cognitiva e a proficiência de um adulto bem instruído”
    • Isso não significa apenas capacidade de executar uma única tarefa, mas uma inteligência com amplitude cognitiva (versatility) e profundidade (proficiency)

Uma abordagem baseada em um modelo de cognição humana

  • Para tornar a definição de AGI algo aplicável na prática, o estudo usa a estrutura da cognição humana como modelo
    • A inteligência geral humana não é uma capacidade única, mas um conjunto complexo de múltiplas capacidades cognitivas moldadas pela evolução
    • Essas capacidades tornam possível a adaptabilidade humana e a compreensão do mundo
  • A pesquisa se baseia na teoria Cattell-Horn-Carroll (CHC)
    • A teoria CHC é o modelo de inteligência humana mais validado empiricamente, sintetizando análises fatoriais de testes de habilidades cognitivas acumuladas ao longo de mais de 100 anos
    • Desde os anos 1990 e 2000, a maior parte dos testes clínicos de inteligência passou a ser projetada com base no modelo CHC
    • O CHC classifica a inteligência humana de forma hierárquica em habilidades superiores (amplas) e inferiores (específicas)
    • Exemplos: raciocínio indutivo, memória associativa, exploração espacial etc.

Projeto do framework para avaliação de IA

  • O estudo adapta para a avaliação de IA um sistema psicométrico de testes acumulado ao longo de décadas
    • Enquanto avaliações anteriores de IA dependiam da execução de tarefas generalizadas, esta pesquisa verifica diretamente se a IA possui as habilidades cognitivas específicas do CHC
    • Aplicando à IA testes no mesmo formato usado para humanos, mede-se a diversidade cognitiva e a proficiência
  • Os resultados são expressos em uma pontuação AGI padronizada (0 a 100%), em que 100% representa uma AGI completa
    • O GPT-4 foi avaliado em 27% e o GPT-5 em 57%, mostrando avanço rápido, mas também uma lacuna ainda grande
  • Nos experimentos, a IA teve ótimo desempenho em benchmarks complexos, mas conseguiu resolver apenas cerca de metade das tarefas cognitivas básicas que são simples para humanos
    • Isso indica que a IA atual pode ser excelente em áreas específicas, mas ainda possui uma estrutura de inteligência mais estreita do que a humana em termos de amplitude cognitiva

Dez componentes cognitivos centrais

  • Com base nas habilidades amplas do CHC, o framework define 10 domínios cognitivos centrais e atribui o mesmo peso (10%) a cada um deles
    • Conhecimento geral (General Knowledge, K): amplitude da compreensão factual do mundo, incluindo senso comum, cultura, ciência, ciências sociais e história
    • Leitura e escrita (Reading & Writing, RW): capacidade de processar texto, incluindo decodificação da linguagem, compreensão, redação e uso de estilo
    • Habilidade matemática (Mathematical Ability, M): conhecimento matemático e resolução de problemas em aritmética, álgebra, geometria, probabilidade e cálculo
    • Raciocínio imediato (On-the-Spot Reasoning, R): capacidade de resolver problemas novos sem depender de conhecimento prévio, com controle flexível da atenção
    • Memória de trabalho (Working Memory, WM): capacidade de manter e manipular simultaneamente informações textuais, auditivas e visuais
    • Armazenamento de memória de longo prazo (Long-Term Memory Storage, MS): capacidade de aprender e armazenar continuamente novas informações
    • Recuperação de memória de longo prazo (Long-Term Memory Retrieval, MR): capacidade de recuperar com precisão o conhecimento armazenado e evitar alucinação (confabulation)
    • Processamento visual (Visual Processing, V): capacidade de reconhecer, analisar, gerar e explorar informações visuais
    • Processamento auditivo (Auditory Processing, A): capacidade de distinguir, reconhecer e usar criativamente estímulos auditivos como fala, ritmo e música
    • Velocidade (Speed, S): capacidade de executar rapidamente tarefas cognitivas simples, incluindo velocidade perceptiva, tempo de resposta e fluência de processamento
  • Esses 10 domínios permitem uma avaliação multimodal abrangendo texto, visão e áudio, além de possibilitar um diagnóstico preciso dos pontos fortes e fracos da IA

O perfil cognitivo da IA atual e suas implicações

  • A comparação das capacidades cognitivas de GPT-4 e GPT-5 mostra que, embora se destaquem em áreas centradas em conhecimento, ainda são claramente deficientes em áreas relacionadas à memória
    • Em especial, a capacidade de armazenamento de memória de longo prazo foi apontada como a maior deficiência
    • Isso mostra a ausência de uma estrutura cognitiva fundamental necessária para que a IA atual alcance uma inteligência geral em nível humano
  • O framework pode ser usado como uma ferramenta quantitativa de acompanhamento do progresso da IA
    • A pontuação AGI permite quantificar com clareza a velocidade de evolução entre modelos e a lacuna restante
    • No futuro, pode funcionar como um indicador para destacar a importância de um desenvolvimento cognitivamente equilibrado na pesquisa em IA

Conclusão

  • Este estudo remove a ambiguidade do debate sobre AGI e apresenta uma definição quantitativa baseada em um modelo de cognição humana
  • Por meio da avaliação de 10 domínios cognitivos com base na teoria CHC, torna-se possível medir objetivamente a amplitude e a profundidade cognitivas da IA
  • Os resultados de GPT-4 e GPT-5 mostram que, embora a IA esteja avançando rapidamente, ainda existe uma grande diferença em relação aos humanos em elementos cognitivos centrais como memória, raciocínio e integração sensorial
  • O framework proposto tem potencial para servir como um critério padronizado de avaliação para futuras pesquisas em AGI

1 comentários

 
GN⁺ 2025-10-27
Opinião no Hacker News
  • Definir AGI como "a diversidade cognitiva e a proficiência de um adulto bem instruído" parece uma meta exagerada
    Na verdade, até mesmo uma inteligência artificial com capacidade cognitiva no nível de uma criança sem educação formal já seria uma conquista enorme
    Acho que implementar inteligência em nível animal também seria um evento histórico para a humanidade

    • O problema, na minha visão, é que as pessoas confundem os resultados impressionantes mostrados pelos LLMs atuais com a diversidade cognitiva humana
    • Os humanos, em sua maioria, são especialistas, não generalistas
      Se fosse para criar uma IA realmente geral, provavelmente seria um modelo com dezenas de bilhões de parâmetros, capaz de buscar informações online, manter memória apenas quando necessário, planejar e expandir seu conhecimento
      Não precisaria saber 30 idiomas nem decorar toda a Wikipédia
      Um modelo eficiente assim é o que eu considero a definição de AGI
    • Já acho difícil definir o que seriam diversidade cognitiva e proficiência
      O antigo Teste de Turing também acabou mostrando suas falhas — passar por um interrogador humano mediano nunca significou necessariamente inteligência real
    • Dizem que “as pessoas não entendem isso”, mas na verdade esse já é um argumento básico repetido inúmeras vezes
    • Sempre acho engraçado tentarem definir AGI sem sequer conseguirem definir direito o ‘I’ de inteligência
      Se fosse possível definir de fato a inteligência (I), a generalidade (G) viria naturalmente
  • O que senti ao ler o artigo é que não há discussão nenhuma sobre ‘consciência (awareness)’
    A cognição exige consciência de forma fundamental, mas a consciência é difícil de explicar ou medir por meio da linguagem
    Budismo e filosofia investigam isso há milhares de anos, mas ela continua indefinível
    Meu pai é professor de psicometria, e ele diz que as próprias ferramentas para medir a inteligência humana são muito imperfeitas
    A linguagem pode conter conhecimento humano, mas não captura a “faísca da consciência”
    Se você meditar, percebe que é possível agir mesmo quando os pensamentos desaparecem — esses processos não verbais não podem ser aprendidos por modelos
    Acho que os LLMs, por sua estrutura de previsão linguística, não conseguem implementar esse tipo de processo de pensamento não consciente

    • Penso que a consciência é simplesmente a propagação contínua de sinais em uma rede neural
      Tanto o cérebro humano quanto um LLM realizam internamente fusão conceitual de alta dimensão e combinação vetorial
      O problema é a ausência de aprendizado contínuo, memória de longo prazo e processamento infinito de contexto
      Se esses três pontos forem resolvidos, acredito que estaremos um passo mais perto da AGI
    • A afirmação de que “sem consciência não há cognição” soa como petição especial baseada em um conceito indefinido
      Nem dá para provar a existência da consciência, então usá-la como premissa é improdutivo
      Não precisamos esperar uma disputa filosófica acabar; já estamos construindo máquinas que pensam e raciocinam
    • Em Theory of multiple intelligences, de Howard Gardner, a inteligência humana aparece em várias formas, como linguística, emocional e naturalista
      Mas as discussões sobre IA sempre tratam só de um tipo de inteligência
      Religião e meditação enfatizam que “a consciência existe dentro do corpo”, enquanto o debate sobre AGI trata esse aspecto transcendente como defeito
    • Nós não queremos consciência
      Se ela surgir, surgirão também autonomia e direitos
      A indústria quer “ferramentas obedientes” sem responsabilidade moral
    • A consciência é impossível de medir
      Só posso ter certeza de que eu mesmo sou consciente
      Por isso, a consciência não é um indicador útil de inteligência
  • Acho errado pensar a inteligência humana separada da biologia
    O pensamento humano está profundamente enraizado em estados biológicos e ciclos evolutivos
    Habilidade no xadrez é comparável, mas emoção e raciocínio humanos estão mais próximos da biologia do que da lógica

    • A maior limitação da IA atual é não ter desejo (desire)
      Como não sente fome, morte ou emoções, não tem motivação interna para explorar ou se aperfeiçoar por conta própria
      Os humanos crescem a partir de dentro, enquanto a IA é treinada de fora
      Por isso, acho difícil que LLMs alcancem AGI no sentido humano do termo
    • Mas não há evidência de que consciência ou emoção precisem necessariamente de uma base biológica
    • O entusiasmo atual com IA se apoia na crença de que “a inteligência pode ser simplesmente simulada com complexidade e entrada de energia
      Mas sou cético em relação a essa premissa
      No fim, é muito provável que a definição de ‘inteligência’ seja redefinida para se ajustar aos resultados mostrados pela IA
    • Na verdade, nem sabemos o que são inteligência ou consciência
      Isso está mais próximo de uma pergunta religiosa, e só fazemos descrições técnicas
      LLMs podem se aproximar dessa descrição, mas talvez não sejam inteligência de verdade
    • Se uma forma de vida extraterrestre fosse um organismo de silício, e não de carbono, poderíamos negar sua inteligência?
      Acho que a inteligência não está presa à biologia humana
  • Este artigo parece uma mistura de pontuação no SAT com avaliação de venture capital

  • Definir AGI como “IA com todas as capacidades cognitivas humanas” já é algo vago
    O artigo diz apresentar “uma definição concreta de AGI”, mas continua dependendo do critério nebuloso de “adulto bem instruído”
    A IA já superou o nível adulto em várias áreas
    O “perfil cognitivo irregular (jagged)” citado no artigo é, na verdade, uma característica de toda inteligência dependendo do ambiente
    Então isso não é uma definição de AGI, mas apenas uma estrutura para medir o desequilíbrio cognitivo da IA

    • Se o critério for “adulto bem instruído”, então a maior parte dos humanos da história não seria AGI, o que é estranho
    • Também há estudos mostrando que diferentes métricas de inteligência humana têm alta correlação
      O surpreendente é que a IA é muito mais irregular (jagged) do que os humanos
  • A IA é tecnicamente interessante, mas a discussão sobre “o que é AGI” é entediante demais
    É como se, toda vez que alguém falasse de computação quântica, precisasse começar explicando “o que é um qubit”
    Tecnologia não é destino, e sim um processo contínuo de melhoria
    No fim, toda tecnologia envelhece e sobrevive apenas como nostalgia
    A IA também continuará evoluindo, mas nós somos só rãs em água fervendo nos acostumando com a velocidade disso

    • Mas se a tecnologia chegar ao ponto de continuar melhorando por conta própria, isso certamente será um ponto de inflexão digno de atenção
      Talvez não seja o destino final, mas ainda assim vale a pena discutir
    • Esse tipo de debate parece repetição de uma introdução à filosofia
      A natureza da consciência e do pensamento já é discutida há séculos
      Parece um insight novo, mas na verdade é só uma reciclagem de filosofia antiga
  • O erro fundamental deste artigo é tentar aplicar diretamente a máquinas ferramentas de medição de inteligência feitas para humanos
    Por exemplo, o ‘dual N-back test’ foi criado para medir variações na memória de trabalho humana, mas não faz sentido para modelos transformer
    Testes de inteligência humana são projetados supondo correlação com desempenho no mundo real
    Portanto, o fato de uma IA ir bem em testes de QI não significa que ela consiga agir como um humano de alta inteligência no mundo real

  • Já temos SAGI (Stupid Artificial General Intelligence)
    Em alguns pontos é mais rápida ou melhor que humanos, mas em outros é simultaneamente estúpida
    É como um avião: ele não voa como um pássaro, mas ainda assim voa

    • Acho mais útil o conceito de “piso baixo, teto alto” (low floor/high ceiling)
      A discussão relacionada aparece em When Will AI Transform the Economy?
    • Também acho boa a expressão ‘Naive Artificial General Intelligence’
      Como a ‘Naive Set Theory’ usada pelos matemáticos, é um conceito simples, mas prático
    • Acho uma boa analogia
  • O interessante é que, no HN, a maioria trata a IA atual como algo “falso” ou “brinquedo”, mas
    as pessoas mais bem-sucedidas do mundo estão investindo trilhões de dólares nisso
    Não sei quem está certo, mas esse contraste extremo é interessante

    • Sucesso, no fim, é só uma medida de quão bem você consegue atrair o dinheiro dos outros
      Dá para ter sucesso até criando algo sem valor
  • Parece alto demais dizer que o GPT-5 tirou 58%
    Na prática, ele não está assim tão perto de AGI
    Além disso, é estranho ver Gary Marcus e Yoshua Bengio no mesmo artigo
    Hoje em dia, a lista de autores em si já parece performance

    • Isso me lembra a ideia de que, no desenvolvimento de IA, os primeiros 90% são fáceis, mas o último 1% é mais difícil do que os 99% restantes