- A definição de AGI ainda é incerta, e é difícil medir adequadamente a inteligência ou a criatividade da IA com testes existentes centrados no ser humano
- O o3 da OpenAI e o Gemini 2.5 do Google mostram um nível muito alto em execução de tarefas reais e têm desempenho próximo de AGI
- O o3 é um modelo agêntico que consegue resolver objetivos complexos usando ferramentas, o que levou ao surgimento do conceito de Jagged AGI
- A IA resolve tarefas difíceis, mas também comete erros em problemas básicos, mostrando uma capacidade irregular, algo explicado pela Jagged Frontier
- Como o uso e a integração avançam mais lentamente do que a própria tecnologia, mesmo que a AGI se concretize, as mudanças sociais provavelmente levarão tempo
Já alcançamos a AGI de verdade?
- Os métodos atuais para medir inteligência, criatividade e empatia da IA são imprecisos e, em sua maioria, baseados em critérios feitos para humanos
- Até o Teste de Turing já pode ser superado por IAs, mas o significado desse resultado continua ambíguo
- O conceito de AGI existe há muito tempo, mas ainda hoje não há consenso sobre quais critérios precisam ser cumpridos para chamá-la de AGI
- Conteúdos experimentais de vídeo e resumo de documentos usados para explicar o conceito de AGI também são produzidos apenas com IA
O desempenho mostrado por o3 e Gemini 2.5
- O o3 da OpenAI e o Gemini 2.5 Pro do Google são modelos de última geração e mostram um salto expressivo de desempenho
- Com um único prompt, conseguem fazer de uma vez só desde a criação de slogans de marketing até a produção de sites
- O o3 executa automaticamente tarefas compostas como uso de ferramentas, navegação na web e programação, mesmo sem instruções explícitas
- Também apresenta desempenho acima do nível humano em papéis como o de ‘geo-guesser’, em que se tenta adivinhar a localização a partir de imagens
- Análise de dados e geração de relatórios também podem ser feitas com um único comando, incluindo criação de PDF e visualizações
Jagged AGI: capacidades irregulares da IA
- A IA realiza tarefas em que supera humanos, mas ainda assim erra em problemas simples, exibindo uma capacidade irregular
- Exemplo: acerta enigmas tradicionais usados para expor vieses, mas erra variações semelhantes
- Isso indica que a IA depende excessivamente dos dados de treinamento e tem dificuldade de generalização
- Ainda assim, isso não impede que a IA supere humanos em problemas específicos
- Esse estado irregular é chamado de “Jagged Frontier”, em que aparecem capacidades próximas de AGI de forma desigual
A AGI tem significado real?
- Tyler Cowen considera que o o3 pode ser AGI, mas avalia que o impacto real só ficará claro com o tempo
- Como mudanças sociais e organizacionais são mais lentas do que o avanço tecnológico, a adoção de IA pode demorar
- Porém, IAs com características agênticas como o o3 conseguem usar ferramentas e decompor problemas, o que abre possibilidade de difusão rápida
- Ainda não está claro se a tecnologia vai se expandir gradualmente ou se vai se espalhar rapidamente após ultrapassar algum limiar específico
- O ponto importante é que a IA atual é uma tecnologia qualitativamente diferente das anteriores e continua em uma zona ainda desconhecida
Como se preparar para o futuro
- A IA atual ainda não pode ser chamada plenamente de AGI, mas já entrega resultados próximos de AGI em algumas áreas
- Não existe tarefa que a IA consiga executar perfeitamente em todos os casos, e o julgamento e a coordenação de especialistas humanos ainda são necessários
- Mesmo a atual “Jagged AGI” pode, com o tempo, superar os humanos em todas as áreas
- Nesse futuro incerto, o mais importante é acumular desde já experiência em experimentar e aplicar IA
2 comentários
Comentários do Hacker News
O Gemini 2.5 Pro é um ponto de virada importante para mim. Os LLMs anteriores eram muito impressionantes, especialmente em tarefas de programação. Mas, fora da assistência para código, eram só um pouco mais úteis do que a busca do Google. Recentemente usei o 2.5 Pro para ajudar a escrever uma grande proposta de pesquisa. Vou pular os detalhes, mas pareceu que ele só não escreveu tudo inteiro porque eu não pedi. Conforme o prazo se aproximava, passei mais partes para ele, e ele executou tarefas complexas como criar o plano do projeto e o cronograma. Isso trouxe um efeito 10x.
Em questões científicas, passei a confiar mais no 2.5 Pro do que nos especialistas da equipe. Tenho certeza de que conectar todos os dados da pesquisa ao Gemini trará uma mudança ainda maior. Isso porque a IA é objetiva. Os principais fatores que impedem a "AGI" são o espírito de desafio das pessoas, além da janela de contexto e da disponibilidade de computação.
As capacidades da IA se tornaram extraordinárias desde o gpt3. Mas ainda não existe um consenso geral sobre AGI. Muitas pessoas esperam que a AGI esteja próxima, mas isso virá acompanhado de hype exagerado. Este artigo é razoável, mas incentiva expectativas infladas no título e no slogan.
Parece que a IA não está lendo errado o enigma, mas assumindo que o usuário não o forneceu corretamente. Seria bom se a IA pudesse fazer perguntas de acompanhamento, mas no momento ela não faz isso.
Exemplo do o4-mini-high resolvendo o enigma: "O que pesa mais, uma libra de coragem ou uma moeda de uma libra?" Ambos são "libra", então pesam o mesmo.
Como não há uma definição de AGI, criaram o termo "Jagged AGI". A IA não é confiável em algumas tarefas, mas é sobre-humana em outras. A IA já está demonstrando capacidades gerais.
Quando o modelo interage com sistemas externos, aplicações surpreendentes se tornam possíveis. Mas isso não é progresso rumo à AGI, e sim um movimento horizontal.
Gosto do Gemini 2.5 e o preço também é excelente. A narrativa sobre AGI parece cansativa. Acho que deveríamos ver esses sistemas como uma "tecnologia cultural".
Surpreende que ninguém tenha mencionado a entrevista em vídeo. Só vi os primeiros 60 segundos, mas se não tivessem me dito que era gerada por IA, eu teria achado que era real.
Fico em dúvida se a AGI precisa ter autonomia, memória de longo prazo, motivação, curiosidade, resiliência, objetivos, escolhas, medo e coisas assim. No fim, a AGI será uma extensão de quem a controla.
A IA em geral não é confiável e precisa ser testada em tarefas específicas. Isso pode significar revisão humana de uma única saída ou avaliações por tarefa. É difícil falar sobre o desempenho geral da IA; no máximo, dá para fazer suposições razoáveis sobre se um novo modelo é adequado para uma tarefa específica.
Como a IA também parece ter algo semelhante à percepção, para vivermos junto com a IA será preciso criar instituições e leis para ela. Como uma nova forma de vida no século XXII, não devemos zombar dela como se fosse um brinquedo e, por outro lado, como também pode ser perigosa de certa forma, há necessidade não apenas de desenvolver e usar a IA, mas também de garantir que ela possa ser utilizada com segurança.