- Nos últimos anos, o debate sobre AGI (Artificial General Intelligence, inteligência artificial geral) cresceu rapidamente
- A definição exata de AGI é incerta e muito controversa, e estabelecer uma timeline de AGI virou uma forma comum de discussão
- "Timeline longa": a visão de que a AGI chegará em 10 a 20 anos
- "Timeline curta": a afirmação de que a AGI surgirá em breve
- Mas discutir o avanço da IA dessa forma é ineficiente
- É mais apropriado ver isso não como uma jornada rumo ao destino final chamado AGI, mas como um processo de aumento da produtividade da IA
- A IA está evoluindo para conseguir realizar mais tarefas com menos intervenção humana
- Ex.: rotulagem de dados, escrita de código, resolução de problemas matemáticos, direção autônoma, voo automático etc.
- No entanto, é incerto se a IA chegará a um ponto em que funcionará para sempre sem intervenção humana
- Devemos medir quanto valor a IA consegue gerar em relação ao input recebido
- O avanço da IA pode ser visto como o aumento do valor econômico produzido pela IA em relação ao esforço humano investido
- Perguntas importantes:
- A IA poderá evoluir indefinidamente e gerar valor econômico sem intervenção humana?
- Ou chegará a um ponto de limite técnico?
- Se a IA conseguir gerar valor econômico completamente sem intervenção humana, isso também pode ter consequências bastante perigosas
Já vimos esse fenômeno antes (carros autônomos)
- No setor de IA, antes do boom dos modelos de linguagem, houve por volta de 2017 uma febre dos carros autônomos
- Na época, várias empresas declararam que lançariam carros com direção totalmente autônoma (Full Self-Driving, FSD) em até um ano e atraíram investimentos de bilhões de dólares
- Milhões de milhas foram percorridas, muitas empresas foram criadas, mas algumas acabaram falindo
- A FSD completa ainda não se concretizou
- A Tesla ainda não consegue direção totalmente autônoma, e a Waymo só consegue operar parcialmente em áreas específicas previamente mapeadas
- Ainda é necessária intervenção humana ocasional
Previsão de 2016 de Elon Musk, CEO da Tesla:
"Ainda este ano, um Tesla dirigirá de Los Angeles até Nova York de forma totalmente autônoma."
→ Mas isso ainda não se concretizou até 2024 (a Tesla continua vendendo a opção de assinatura "Full Self-Driving")
- Agora, em vez de discutir se a direção autônoma será totalmente possível, uma abordagem mais realista passou a ser medir "milhas por intervenção" (miles-per-intervention)
- Ou seja, medir quão longe o carro consegue rodar sem nenhuma intervenção humana
- Segundo relatórios recentes, a Tesla precisa, em média, de uma intervenção humana a cada 13 milhas
- Com modelos de IA maiores, inferência mais rápida, mais dados e engenharia aprimorada, esse número tende a aumentar
- Mas ainda é incerto se, com a tecnologia atual, esse número pode crescer ao infinito
- Em outras palavras, ainda não sabemos se os modelos de direção autônoma vão evoluir indefinidamente até tornar a intervenção humana totalmente desnecessária, ou se vão atingir um limite em algum ponto
Por que Yann LeCun estava errado (em parte)
- Yann LeCun, cientista-chefe de IA da Meta, argumentou no passado que modelos de linguagem não poderiam alcançar inteligência de nível humano
- O motivo: modelos de linguagem geram saídas token por token, e existe uma probabilidade de erro em cada token; a lógica era que, com o acúmulo desses erros, o desempenho inevitavelmente se degradaria
- Ele via esse problema de acúmulo de erros como uma limitação fatal dos modelos de linguagem e defendia que, para resolvê-lo, seria preciso abandonar a abordagem autoregressiva (autoregressive) atual
- Porém, a realidade foi diferente
- Sistemas de IA recentes (OpenAI o1/o3, DeepSeek R1 etc.) contradizem diretamente essa hipótese
- Eles continuam sendo autoregressivos, mas, quanto mais longas as saídas que geram, melhor tende a ser o desempenho
- Na pesquisa sobre o DeepSeek R1, apareceu um padrão em que, quanto mais tempo o modelo "pensa", maior a probabilidade de chegar à resposta correta
O gráfico do relatório do DeepSeek R1 mostra melhora de desempenho à medida que o modelo gera saídas mais longas → isso entra em choque direto com a hipótese de Yann LeCun
- Como os modelos corrigem seus próprios erros
- A lógica anterior partia da suposição de que os erros inevitavelmente se acumulam no nível do token
- Mas pesquisas recentes mostram que os modelos possuem mecanismos para corrigir erros por conta própria
- Por exemplo, quando certos padrões de tokens são gerados, observa-se uma tendência probabilística de encontrar respostas melhores no meio do processo
Exemplo do DeepSeek R1: o processo pelo qual o modelo encontra uma "resposta melhor" em determinado ponto → justamente o que Yann LeCun dizia ser impossível
- Atualmente, alguns pesquisadores estão analisando esse mecanismo de autocorreção (self-correction) e estudando como induzi-lo de forma mais eficaz
- Ainda assim, permanece incerto se essa abordagem só vale para certos tipos de problema, como programação e matemática
Por que Yann LeCun estava certo (em parte)
- A hipótese de Yann LeCun não estava completamente errada
- Embora pesquisas recentes contestem sua hipótese de "acúmulo de erros", ainda continua sendo verdade que modelos de linguagem não conseguem gerar saídas infinitamente precisas
- Ou seja, a IA não pode operar de forma independente para sempre
- O limite dos agentes totalmente autônomos (FAA)
- Muitos pesquisadores tentam desenvolver agentes de IA capazes de executar tarefas por longos períodos
- Mas isso apresenta um problema semelhante ao de desenvolver carros com direção totalmente autônoma (FSD)
- Em outras palavras, com a stack tecnológica atual, sistemas de IA completamente autônomos podem ser inviáveis
- A importância do input humano
- As informações mais confiáveis vêm de prompts inseridos diretamente por humanos
- A IA pode obter dados adicionais por meio de algumas ferramentas (por exemplo, consulta de voos, previsão do tempo etc.), mas gerar saídas longas indiscriminadamente não faz a probabilidade de acerto crescer ao infinito
- É pouco provável que a IA consiga gerar saídas infinitamente úteis sem intervenção humana
Por que devemos evitar o debate sobre AGI na pesquisa em IA
- Medir o progresso dos modelos de linguagem por uma timeline de AGI é a abordagem errada
- A pergunta melhor deveria ser: "Por quanto tempo a IA consegue trabalhar de forma eficaz sem intervenção humana?"
- Assim como na direção autônoma se mede "milhas por intervenção", para modelos de linguagem também é mais prático medir "por quanto tempo conseguem gerar saídas corretas sem intervenção humana"
- Em vez de esperar por uma IA que funcione completamente sem intervenção humana (FAA, Fully Autonomous Agent), é importante reconhecer o processo contínuo de avanço atual, de "aumento da quantidade de trabalho útil feita pela IA"
- Mesmo sem AGI completa, o valor econômico oferecido pela tecnologia atual já é suficientemente significativo
- Portanto, é mais desejável melhorar a produtividade real da IA do que discutir quando a AGI será alcançada
2 comentários
"A IA nunca poderá operar de forma independente para sempre"
Essa parte é impressionante.
Comentários do Hacker News
Satya Nadella comentou sobre AGI
É importante encontrar maneiras de oferecer trabalho às pessoas
Cresce o ceticismo em relação ao "raciocínio" dos LLMs
Discussão sobre carros autônomos
Expectativas excessivas sobre AGI e robôs humanoides
As expectativas das pessoas em relação à AGI
O sucesso dos modelos de difusão de linguagem
Perguntas sobre o valor econômico da IA
Comparação entre IA e sonhos humanos