- Na pesquisa em inteligência artificial, a ausência de uma definição clara de AGI (Artificial General Intelligence) vem obscurecendo a lacuna entre a cognição em nível humano e a IA atual
- Este artigo propõe um framework quantificável para definir AGI como “uma IA com a diversidade cognitiva e a proficiência de um adulto bem instruído”
- Com base na teoria Cattell-Horn-Carroll (CHC), um modelo de referência no estudo da cognição humana, a inteligência geral humana é decomposta em 10 domínios cognitivos centrais e aplicada à avaliação de IA
- Por meio desse framework, os perfis cognitivos de GPT-4 e GPT-5 foram quantificados; o GPT-4 registrou 27% e o GPT-5, 57% de pontuação AGI
- Isso mostra o rápido avanço da IA, mas também sugere que ainda existe uma grande distância até alcançar AGI devido à falta de capacidades cognitivas fundamentais, como o armazenamento de memória de longo prazo
A necessidade de definir AGI e o problema percebido
- AGI (Artificial General Intelligence) é considerada um dos avanços tecnológicos mais importantes da história da humanidade, mas sua definição ambígua gera debates
- À medida que a IA passa a dominar gradualmente áreas como matemática e arte, antes vistas como dependentes da inteligência humana, ocorre o fenômeno de deslocamento contínuo do critério do que seria “AGI”
- Com isso, as discussões sobre quando AGI será alcançada ou em que nível se encontra acabam se tornando pouco produtivas, enquanto a distância real entre a IA atual e a AGI fica encoberta
- Para eliminar essa ambiguidade, o artigo apresenta um framework quantitativo e sistemático
- Definição proposta: “AGI é uma IA com a diversidade cognitiva e a proficiência de um adulto bem instruído”
- Isso não significa apenas capacidade de executar uma única tarefa, mas uma inteligência com amplitude cognitiva (versatility) e profundidade (proficiency)
Uma abordagem baseada em um modelo de cognição humana
- Para tornar a definição de AGI algo aplicável na prática, o estudo usa a estrutura da cognição humana como modelo
- A inteligência geral humana não é uma capacidade única, mas um conjunto complexo de múltiplas capacidades cognitivas moldadas pela evolução
- Essas capacidades tornam possível a adaptabilidade humana e a compreensão do mundo
- A pesquisa se baseia na teoria Cattell-Horn-Carroll (CHC)
- A teoria CHC é o modelo de inteligência humana mais validado empiricamente, sintetizando análises fatoriais de testes de habilidades cognitivas acumuladas ao longo de mais de 100 anos
- Desde os anos 1990 e 2000, a maior parte dos testes clínicos de inteligência passou a ser projetada com base no modelo CHC
- O CHC classifica a inteligência humana de forma hierárquica em habilidades superiores (amplas) e inferiores (específicas)
- Exemplos: raciocínio indutivo, memória associativa, exploração espacial etc.
Projeto do framework para avaliação de IA
- O estudo adapta para a avaliação de IA um sistema psicométrico de testes acumulado ao longo de décadas
- Enquanto avaliações anteriores de IA dependiam da execução de tarefas generalizadas, esta pesquisa verifica diretamente se a IA possui as habilidades cognitivas específicas do CHC
- Aplicando à IA testes no mesmo formato usado para humanos, mede-se a diversidade cognitiva e a proficiência
- Os resultados são expressos em uma pontuação AGI padronizada (0 a 100%), em que 100% representa uma AGI completa
- O GPT-4 foi avaliado em 27% e o GPT-5 em 57%, mostrando avanço rápido, mas também uma lacuna ainda grande
- Nos experimentos, a IA teve ótimo desempenho em benchmarks complexos, mas conseguiu resolver apenas cerca de metade das tarefas cognitivas básicas que são simples para humanos
- Isso indica que a IA atual pode ser excelente em áreas específicas, mas ainda possui uma estrutura de inteligência mais estreita do que a humana em termos de amplitude cognitiva
Dez componentes cognitivos centrais
- Com base nas habilidades amplas do CHC, o framework define 10 domínios cognitivos centrais e atribui o mesmo peso (10%) a cada um deles
- Conhecimento geral (General Knowledge, K): amplitude da compreensão factual do mundo, incluindo senso comum, cultura, ciência, ciências sociais e história
- Leitura e escrita (Reading & Writing, RW): capacidade de processar texto, incluindo decodificação da linguagem, compreensão, redação e uso de estilo
- Habilidade matemática (Mathematical Ability, M): conhecimento matemático e resolução de problemas em aritmética, álgebra, geometria, probabilidade e cálculo
- Raciocínio imediato (On-the-Spot Reasoning, R): capacidade de resolver problemas novos sem depender de conhecimento prévio, com controle flexível da atenção
- Memória de trabalho (Working Memory, WM): capacidade de manter e manipular simultaneamente informações textuais, auditivas e visuais
- Armazenamento de memória de longo prazo (Long-Term Memory Storage, MS): capacidade de aprender e armazenar continuamente novas informações
- Recuperação de memória de longo prazo (Long-Term Memory Retrieval, MR): capacidade de recuperar com precisão o conhecimento armazenado e evitar alucinação (confabulation)
- Processamento visual (Visual Processing, V): capacidade de reconhecer, analisar, gerar e explorar informações visuais
- Processamento auditivo (Auditory Processing, A): capacidade de distinguir, reconhecer e usar criativamente estímulos auditivos como fala, ritmo e música
- Velocidade (Speed, S): capacidade de executar rapidamente tarefas cognitivas simples, incluindo velocidade perceptiva, tempo de resposta e fluência de processamento
- Esses 10 domínios permitem uma avaliação multimodal abrangendo texto, visão e áudio, além de possibilitar um diagnóstico preciso dos pontos fortes e fracos da IA
O perfil cognitivo da IA atual e suas implicações
- A comparação das capacidades cognitivas de GPT-4 e GPT-5 mostra que, embora se destaquem em áreas centradas em conhecimento, ainda são claramente deficientes em áreas relacionadas à memória
- Em especial, a capacidade de armazenamento de memória de longo prazo foi apontada como a maior deficiência
- Isso mostra a ausência de uma estrutura cognitiva fundamental necessária para que a IA atual alcance uma inteligência geral em nível humano
- O framework pode ser usado como uma ferramenta quantitativa de acompanhamento do progresso da IA
- A pontuação AGI permite quantificar com clareza a velocidade de evolução entre modelos e a lacuna restante
- No futuro, pode funcionar como um indicador para destacar a importância de um desenvolvimento cognitivamente equilibrado na pesquisa em IA
Conclusão
- Este estudo remove a ambiguidade do debate sobre AGI e apresenta uma definição quantitativa baseada em um modelo de cognição humana
- Por meio da avaliação de 10 domínios cognitivos com base na teoria CHC, torna-se possível medir objetivamente a amplitude e a profundidade cognitivas da IA
- Os resultados de GPT-4 e GPT-5 mostram que, embora a IA esteja avançando rapidamente, ainda existe uma grande diferença em relação aos humanos em elementos cognitivos centrais como memória, raciocínio e integração sensorial
- O framework proposto tem potencial para servir como um critério padronizado de avaliação para futuras pesquisas em AGI
1 comentários
Opinião no Hacker News
Definir AGI como "a diversidade cognitiva e a proficiência de um adulto bem instruído" parece uma meta exagerada
Na verdade, até mesmo uma inteligência artificial com capacidade cognitiva no nível de uma criança sem educação formal já seria uma conquista enorme
Acho que implementar inteligência em nível animal também seria um evento histórico para a humanidade
Se fosse para criar uma IA realmente geral, provavelmente seria um modelo com dezenas de bilhões de parâmetros, capaz de buscar informações online, manter memória apenas quando necessário, planejar e expandir seu conhecimento
Não precisaria saber 30 idiomas nem decorar toda a Wikipédia
Um modelo eficiente assim é o que eu considero a definição de AGI
O antigo Teste de Turing também acabou mostrando suas falhas — passar por um interrogador humano mediano nunca significou necessariamente inteligência real
Se fosse possível definir de fato a inteligência (I), a generalidade (G) viria naturalmente
O que senti ao ler o artigo é que não há discussão nenhuma sobre ‘consciência (awareness)’
A cognição exige consciência de forma fundamental, mas a consciência é difícil de explicar ou medir por meio da linguagem
Budismo e filosofia investigam isso há milhares de anos, mas ela continua indefinível
Meu pai é professor de psicometria, e ele diz que as próprias ferramentas para medir a inteligência humana são muito imperfeitas
A linguagem pode conter conhecimento humano, mas não captura a “faísca da consciência”
Se você meditar, percebe que é possível agir mesmo quando os pensamentos desaparecem — esses processos não verbais não podem ser aprendidos por modelos
Acho que os LLMs, por sua estrutura de previsão linguística, não conseguem implementar esse tipo de processo de pensamento não consciente
Tanto o cérebro humano quanto um LLM realizam internamente fusão conceitual de alta dimensão e combinação vetorial
O problema é a ausência de aprendizado contínuo, memória de longo prazo e processamento infinito de contexto
Se esses três pontos forem resolvidos, acredito que estaremos um passo mais perto da AGI
Nem dá para provar a existência da consciência, então usá-la como premissa é improdutivo
Não precisamos esperar uma disputa filosófica acabar; já estamos construindo máquinas que pensam e raciocinam
Mas as discussões sobre IA sempre tratam só de um tipo de inteligência
Religião e meditação enfatizam que “a consciência existe dentro do corpo”, enquanto o debate sobre AGI trata esse aspecto transcendente como defeito
Se ela surgir, surgirão também autonomia e direitos
A indústria quer “ferramentas obedientes” sem responsabilidade moral
Só posso ter certeza de que eu mesmo sou consciente
Por isso, a consciência não é um indicador útil de inteligência
Acho errado pensar a inteligência humana separada da biologia
O pensamento humano está profundamente enraizado em estados biológicos e ciclos evolutivos
Habilidade no xadrez é comparável, mas emoção e raciocínio humanos estão mais próximos da biologia do que da lógica
Como não sente fome, morte ou emoções, não tem motivação interna para explorar ou se aperfeiçoar por conta própria
Os humanos crescem a partir de dentro, enquanto a IA é treinada de fora
Por isso, acho difícil que LLMs alcancem AGI no sentido humano do termo
Mas sou cético em relação a essa premissa
No fim, é muito provável que a definição de ‘inteligência’ seja redefinida para se ajustar aos resultados mostrados pela IA
Isso está mais próximo de uma pergunta religiosa, e só fazemos descrições técnicas
LLMs podem se aproximar dessa descrição, mas talvez não sejam inteligência de verdade
Acho que a inteligência não está presa à biologia humana
Este artigo parece uma mistura de pontuação no SAT com avaliação de venture capital
Definir AGI como “IA com todas as capacidades cognitivas humanas” já é algo vago
O artigo diz apresentar “uma definição concreta de AGI”, mas continua dependendo do critério nebuloso de “adulto bem instruído”
A IA já superou o nível adulto em várias áreas
O “perfil cognitivo irregular (jagged)” citado no artigo é, na verdade, uma característica de toda inteligência dependendo do ambiente
Então isso não é uma definição de AGI, mas apenas uma estrutura para medir o desequilíbrio cognitivo da IA
O surpreendente é que a IA é muito mais irregular (jagged) do que os humanos
A IA é tecnicamente interessante, mas a discussão sobre “o que é AGI” é entediante demais
É como se, toda vez que alguém falasse de computação quântica, precisasse começar explicando “o que é um qubit”
Tecnologia não é destino, e sim um processo contínuo de melhoria
No fim, toda tecnologia envelhece e sobrevive apenas como nostalgia
A IA também continuará evoluindo, mas nós somos só rãs em água fervendo nos acostumando com a velocidade disso
Talvez não seja o destino final, mas ainda assim vale a pena discutir
A natureza da consciência e do pensamento já é discutida há séculos
Parece um insight novo, mas na verdade é só uma reciclagem de filosofia antiga
O erro fundamental deste artigo é tentar aplicar diretamente a máquinas ferramentas de medição de inteligência feitas para humanos
Por exemplo, o ‘dual N-back test’ foi criado para medir variações na memória de trabalho humana, mas não faz sentido para modelos transformer
Testes de inteligência humana são projetados supondo correlação com desempenho no mundo real
Portanto, o fato de uma IA ir bem em testes de QI não significa que ela consiga agir como um humano de alta inteligência no mundo real
Já temos SAGI (Stupid Artificial General Intelligence)
Em alguns pontos é mais rápida ou melhor que humanos, mas em outros é simultaneamente estúpida
É como um avião: ele não voa como um pássaro, mas ainda assim voa
A discussão relacionada aparece em When Will AI Transform the Economy?
Como a ‘Naive Set Theory’ usada pelos matemáticos, é um conceito simples, mas prático
O interessante é que, no HN, a maioria trata a IA atual como algo “falso” ou “brinquedo”, mas
as pessoas mais bem-sucedidas do mundo estão investindo trilhões de dólares nisso
Não sei quem está certo, mas esse contraste extremo é interessante
Dá para ter sucesso até criando algo sem valor
Parece alto demais dizer que o GPT-5 tirou 58%
Na prática, ele não está assim tão perto de AGI
Além disso, é estranho ver Gary Marcus e Yoshua Bengio no mesmo artigo
Hoje em dia, a lista de autores em si já parece performance