Sobre a AGI irregular (Jagged): o3, Gemini 2.5 e as IAs que virão depois

(oneusefulthing.org)

4 pontos por GN⁺ 2025-04-22 | 2 comentários | Compartilhar no WhatsApp

A definição de AGI ainda é incerta, e é difícil medir adequadamente a inteligência ou a criatividade da IA com testes existentes centrados no ser humano
O o3 da OpenAI e o Gemini 2.5 do Google mostram um nível muito alto em execução de tarefas reais e têm desempenho próximo de AGI
O o3 é um modelo agêntico que consegue resolver objetivos complexos usando ferramentas, o que levou ao surgimento do conceito de Jagged AGI
A IA resolve tarefas difíceis, mas também comete erros em problemas básicos, mostrando uma capacidade irregular, algo explicado pela Jagged Frontier
Como o uso e a integração avançam mais lentamente do que a própria tecnologia, mesmo que a AGI se concretize, as mudanças sociais provavelmente levarão tempo

Já alcançamos a AGI de verdade?

Os métodos atuais para medir inteligência, criatividade e empatia da IA são imprecisos e, em sua maioria, baseados em critérios feitos para humanos
Até o Teste de Turing já pode ser superado por IAs, mas o significado desse resultado continua ambíguo
O conceito de AGI existe há muito tempo, mas ainda hoje não há consenso sobre quais critérios precisam ser cumpridos para chamá-la de AGI
Conteúdos experimentais de vídeo e resumo de documentos usados para explicar o conceito de AGI também são produzidos apenas com IA

O desempenho mostrado por o3 e Gemini 2.5

O o3 da OpenAI e o Gemini 2.5 Pro do Google são modelos de última geração e mostram um salto expressivo de desempenho
Com um único prompt, conseguem fazer de uma vez só desde a criação de slogans de marketing até a produção de sites
O o3 executa automaticamente tarefas compostas como uso de ferramentas, navegação na web e programação, mesmo sem instruções explícitas
Também apresenta desempenho acima do nível humano em papéis como o de ‘geo-guesser’, em que se tenta adivinhar a localização a partir de imagens
Análise de dados e geração de relatórios também podem ser feitas com um único comando, incluindo criação de PDF e visualizações

Jagged AGI: capacidades irregulares da IA

A IA realiza tarefas em que supera humanos, mas ainda assim erra em problemas simples, exibindo uma capacidade irregular
Exemplo: acerta enigmas tradicionais usados para expor vieses, mas erra variações semelhantes
Isso indica que a IA depende excessivamente dos dados de treinamento e tem dificuldade de generalização
Ainda assim, isso não impede que a IA supere humanos em problemas específicos
Esse estado irregular é chamado de “Jagged Frontier”, em que aparecem capacidades próximas de AGI de forma desigual

A AGI tem significado real?

Tyler Cowen considera que o o3 pode ser AGI, mas avalia que o impacto real só ficará claro com o tempo
Como mudanças sociais e organizacionais são mais lentas do que o avanço tecnológico, a adoção de IA pode demorar
Porém, IAs com características agênticas como o o3 conseguem usar ferramentas e decompor problemas, o que abre possibilidade de difusão rápida
Ainda não está claro se a tecnologia vai se expandir gradualmente ou se vai se espalhar rapidamente após ultrapassar algum limiar específico
O ponto importante é que a IA atual é uma tecnologia qualitativamente diferente das anteriores e continua em uma zona ainda desconhecida

Como se preparar para o futuro

A IA atual ainda não pode ser chamada plenamente de AGI, mas já entrega resultados próximos de AGI em algumas áreas
Não existe tarefa que a IA consiga executar perfeitamente em todos os casos, e o julgamento e a coordenação de especialistas humanos ainda são necessários
Mesmo a atual “Jagged AGI” pode, com o tempo, superar os humanos em todas as áreas
Nesse futuro incerto, o mais importante é acumular desde já experiência em experimentar e aplicar IA

2 comentários

GN⁺ 2025-04-22

Comentários do Hacker News

O Gemini 2.5 Pro é um ponto de virada importante para mim. Os LLMs anteriores eram muito impressionantes, especialmente em tarefas de programação. Mas, fora da assistência para código, eram só um pouco mais úteis do que a busca do Google. Recentemente usei o 2.5 Pro para ajudar a escrever uma grande proposta de pesquisa. Vou pular os detalhes, mas pareceu que ele só não escreveu tudo inteiro porque eu não pedi. Conforme o prazo se aproximava, passei mais partes para ele, e ele executou tarefas complexas como criar o plano do projeto e o cronograma. Isso trouxe um efeito 10x.
Em questões científicas, passei a confiar mais no 2.5 Pro do que nos especialistas da equipe. Tenho certeza de que conectar todos os dados da pesquisa ao Gemini trará uma mudança ainda maior. Isso porque a IA é objetiva. Os principais fatores que impedem a "AGI" são o espírito de desafio das pessoas, além da janela de contexto e da disponibilidade de computação.
As capacidades da IA se tornaram extraordinárias desde o gpt3. Mas ainda não existe um consenso geral sobre AGI. Muitas pessoas esperam que a AGI esteja próxima, mas isso virá acompanhado de hype exagerado. Este artigo é razoável, mas incentiva expectativas infladas no título e no slogan.
Parece que a IA não está lendo errado o enigma, mas assumindo que o usuário não o forneceu corretamente. Seria bom se a IA pudesse fazer perguntas de acompanhamento, mas no momento ela não faz isso.
Exemplo do o4-mini-high resolvendo o enigma: "O que pesa mais, uma libra de coragem ou uma moeda de uma libra?" Ambos são "libra", então pesam o mesmo.
Como não há uma definição de AGI, criaram o termo "Jagged AGI". A IA não é confiável em algumas tarefas, mas é sobre-humana em outras. A IA já está demonstrando capacidades gerais.
Quando o modelo interage com sistemas externos, aplicações surpreendentes se tornam possíveis. Mas isso não é progresso rumo à AGI, e sim um movimento horizontal.
Gosto do Gemini 2.5 e o preço também é excelente. A narrativa sobre AGI parece cansativa. Acho que deveríamos ver esses sistemas como uma "tecnologia cultural".
Surpreende que ninguém tenha mencionado a entrevista em vídeo. Só vi os primeiros 60 segundos, mas se não tivessem me dito que era gerada por IA, eu teria achado que era real.
Fico em dúvida se a AGI precisa ter autonomia, memória de longo prazo, motivação, curiosidade, resiliência, objetivos, escolhas, medo e coisas assim. No fim, a AGI será uma extensão de quem a controla.
A IA em geral não é confiável e precisa ser testada em tarefas específicas. Isso pode significar revisão humana de uma única saída ou avaliações por tarefa. É difícil falar sobre o desempenho geral da IA; no máximo, dá para fazer suposições razoáveis sobre se um novo modelo é adequado para uma tarefa específica.

thd34 2025-04-22

Como a IA também parece ter algo semelhante à percepção, para vivermos junto com a IA será preciso criar instituições e leis para ela. Como uma nova forma de vida no século XXII, não devemos zombar dela como se fosse um brinquedo e, por outro lado, como também pode ser perigosa de certa forma, há necessidade não apenas de desenvolver e usar a IA, mas também de garantir que ela possa ser utilizada com segurança.