Acho que Yann LeCun estava certo sobre LLMs (embora possa ter sido por acaso)

(substack.com)

21 pontos por GN⁺ 2025-02-24 | 2 comentários | Compartilhar no WhatsApp

Nos últimos anos, o debate sobre AGI (Artificial General Intelligence, inteligência artificial geral) cresceu rapidamente
A definição exata de AGI é incerta e muito controversa, e estabelecer uma timeline de AGI virou uma forma comum de discussão
- "Timeline longa": a visão de que a AGI chegará em 10 a 20 anos
- "Timeline curta": a afirmação de que a AGI surgirá em breve
Mas discutir o avanço da IA dessa forma é ineficiente
- É mais apropriado ver isso não como uma jornada rumo ao destino final chamado AGI, mas como um processo de aumento da produtividade da IA
- A IA está evoluindo para conseguir realizar mais tarefas com menos intervenção humana
  - Ex.: rotulagem de dados, escrita de código, resolução de problemas matemáticos, direção autônoma, voo automático etc.
- No entanto, é incerto se a IA chegará a um ponto em que funcionará para sempre sem intervenção humana
- Devemos medir quanto valor a IA consegue gerar em relação ao input recebido
O avanço da IA pode ser visto como o aumento do valor econômico produzido pela IA em relação ao esforço humano investido
Perguntas importantes:
- A IA poderá evoluir indefinidamente e gerar valor econômico sem intervenção humana?
- Ou chegará a um ponto de limite técnico?
Se a IA conseguir gerar valor econômico completamente sem intervenção humana, isso também pode ter consequências bastante perigosas

Já vimos esse fenômeno antes (carros autônomos)

No setor de IA, antes do boom dos modelos de linguagem, houve por volta de 2017 uma febre dos carros autônomos
- Na época, várias empresas declararam que lançariam carros com direção totalmente autônoma (Full Self-Driving, FSD) em até um ano e atraíram investimentos de bilhões de dólares
- Milhões de milhas foram percorridas, muitas empresas foram criadas, mas algumas acabaram falindo
A FSD completa ainda não se concretizou
- A Tesla ainda não consegue direção totalmente autônoma, e a Waymo só consegue operar parcialmente em áreas específicas previamente mapeadas
- Ainda é necessária intervenção humana ocasional

Previsão de 2016 de Elon Musk, CEO da Tesla:
"Ainda este ano, um Tesla dirigirá de Los Angeles até Nova York de forma totalmente autônoma."
→ Mas isso ainda não se concretizou até 2024 (a Tesla continua vendendo a opção de assinatura "Full Self-Driving")

Agora, em vez de discutir se a direção autônoma será totalmente possível, uma abordagem mais realista passou a ser medir "milhas por intervenção" (miles-per-intervention)
- Ou seja, medir quão longe o carro consegue rodar sem nenhuma intervenção humana
Segundo relatórios recentes, a Tesla precisa, em média, de uma intervenção humana a cada 13 milhas
- Com modelos de IA maiores, inferência mais rápida, mais dados e engenharia aprimorada, esse número tende a aumentar
- Mas ainda é incerto se, com a tecnologia atual, esse número pode crescer ao infinito
Em outras palavras, ainda não sabemos se os modelos de direção autônoma vão evoluir indefinidamente até tornar a intervenção humana totalmente desnecessária, ou se vão atingir um limite em algum ponto

Por que Yann LeCun estava errado (em parte)

Yann LeCun, cientista-chefe de IA da Meta, argumentou no passado que modelos de linguagem não poderiam alcançar inteligência de nível humano
O motivo: modelos de linguagem geram saídas token por token, e existe uma probabilidade de erro em cada token; a lógica era que, com o acúmulo desses erros, o desempenho inevitavelmente se degradaria
Ele via esse problema de acúmulo de erros como uma limitação fatal dos modelos de linguagem e defendia que, para resolvê-lo, seria preciso abandonar a abordagem autoregressiva (autoregressive) atual
Porém, a realidade foi diferente
- Sistemas de IA recentes (OpenAI o1/o3, DeepSeek R1 etc.) contradizem diretamente essa hipótese
- Eles continuam sendo autoregressivos, mas, quanto mais longas as saídas que geram, melhor tende a ser o desempenho
- Na pesquisa sobre o DeepSeek R1, apareceu um padrão em que, quanto mais tempo o modelo "pensa", maior a probabilidade de chegar à resposta correta
  
  O gráfico do relatório do DeepSeek R1 mostra melhora de desempenho à medida que o modelo gera saídas mais longas → isso entra em choque direto com a hipótese de Yann LeCun
Como os modelos corrigem seus próprios erros
- A lógica anterior partia da suposição de que os erros inevitavelmente se acumulam no nível do token
- Mas pesquisas recentes mostram que os modelos possuem mecanismos para corrigir erros por conta própria
- Por exemplo, quando certos padrões de tokens são gerados, observa-se uma tendência probabilística de encontrar respostas melhores no meio do processo
  
  Exemplo do DeepSeek R1: o processo pelo qual o modelo encontra uma "resposta melhor" em determinado ponto → justamente o que Yann LeCun dizia ser impossível
Atualmente, alguns pesquisadores estão analisando esse mecanismo de autocorreção (self-correction) e estudando como induzi-lo de forma mais eficaz
Ainda assim, permanece incerto se essa abordagem só vale para certos tipos de problema, como programação e matemática

Por que Yann LeCun estava certo (em parte)

A hipótese de Yann LeCun não estava completamente errada
Embora pesquisas recentes contestem sua hipótese de "acúmulo de erros", ainda continua sendo verdade que modelos de linguagem não conseguem gerar saídas infinitamente precisas
Ou seja, a IA não pode operar de forma independente para sempre
O limite dos agentes totalmente autônomos (FAA)
- Muitos pesquisadores tentam desenvolver agentes de IA capazes de executar tarefas por longos períodos
- Mas isso apresenta um problema semelhante ao de desenvolver carros com direção totalmente autônoma (FSD)
- Em outras palavras, com a stack tecnológica atual, sistemas de IA completamente autônomos podem ser inviáveis
A importância do input humano
- As informações mais confiáveis vêm de prompts inseridos diretamente por humanos
- A IA pode obter dados adicionais por meio de algumas ferramentas (por exemplo, consulta de voos, previsão do tempo etc.), mas gerar saídas longas indiscriminadamente não faz a probabilidade de acerto crescer ao infinito
- É pouco provável que a IA consiga gerar saídas infinitamente úteis sem intervenção humana

Por que devemos evitar o debate sobre AGI na pesquisa em IA

Medir o progresso dos modelos de linguagem por uma timeline de AGI é a abordagem errada
A pergunta melhor deveria ser: "Por quanto tempo a IA consegue trabalhar de forma eficaz sem intervenção humana?"
Assim como na direção autônoma se mede "milhas por intervenção", para modelos de linguagem também é mais prático medir "por quanto tempo conseguem gerar saídas corretas sem intervenção humana"
Em vez de esperar por uma IA que funcione completamente sem intervenção humana (FAA, Fully Autonomous Agent), é importante reconhecer o processo contínuo de avanço atual, de "aumento da quantidade de trabalho útil feita pela IA"
Mesmo sem AGI completa, o valor econômico oferecido pela tecnologia atual já é suficientemente significativo
Portanto, é mais desejável melhorar a produtividade real da IA do que discutir quando a AGI será alcançada

2 comentários

princox 2025-02-27

"A IA nunca poderá operar de forma independente para sempre"

Essa parte é impressionante.

GN⁺ 2025-02-24

Comentários do Hacker News

Satya Nadella comentou sobre AGI
- Mais importante do que a receita da Microsoft é moderar o hype excessivo em torno da AGI
- A taxa de crescimento econômico dos países desenvolvidos é de apenas 2% e, considerando a inflação, é quase 0%
- Em 2025 haverá desafios para o crescimento econômico
- É preciso alcançar um crescimento comparável ao da Revolução Industrial
- Quem sairá vencedor serão as indústrias que utilizarem AGI, não as empresas de tecnologia em si
- Quando a produtividade aumenta e a economia cresce rapidamente, a indústria também se desenvolve
- Não faz sentido se vangloriar dos resultados da AGI; o verdadeiro critério é a economia mundial crescer 10%
É importante encontrar maneiras de oferecer trabalho às pessoas
- A mudança de marketing de AGI para ASI é uma armadilha
- Apesar das críticas à economia "gig", muitas pessoas estão vivendo melhor por meio de Uber e DoorDash
- Uber e DoorDash têm valor no dia a dia
- Dá-se gorjeta aos entregadores para que possam ganhar mais do que o salário mínimo
- Nem todo mundo pode se tornar engenheiro de software autodidata ou empreendedor
- É importante oferecer trabalho às pessoas
Cresce o ceticismo em relação ao "raciocínio" dos LLMs
- Pelos resultados do DeepSeek e do Grok, foi possível ver as limitações dos LLMs
- Há casos em que o modelo cai em caminhos ineficientes ou errados
- Por exemplo, o Grok 3 passou 10 minutos verificando repetidamente o nome de uma carta específica
- Há casos em que o modelo entra em um comportamento improdutivo auto-reforçado
Discussão sobre carros autônomos
- A Tesla ainda não é capaz de direção totalmente autônoma, e a Waymo só consegue isso em regiões específicas
- Alguns sistemas de IA melhoram ao gerar saídas mais longas
- Porém, saídas longas não tornam necessariamente o modelo melhor
- O argumento de LeCun aponta o problema de acúmulo de erros nos modelos de linguagem
Expectativas excessivas sobre AGI e robôs humanoides
- É preciso focar no benefício econômico mais do que na AGI
- O objetivo da AGI é superar 99,99% dos humanos
As expectativas das pessoas em relação à AGI
- As pessoas querem algo diferente de AGI
- Se a AGI tiver autonomia, ela se tornará incontrolável
- As pessoas querem especialistas tecnicamente brilhantes, mas que sigam instruções
O sucesso dos modelos de difusão de linguagem
- Usa-se uma estratégia de remasking para resolver o problema de acúmulo de erros
- Houve sucesso em prever vários tokens ao mesmo tempo
Perguntas sobre o valor econômico da IA
- Quando a IA aumenta a produtividade humana, para quem será transferido o valor econômico
- Se o emprego humano diminuir, será necessário um plano para a distribuição do valor econômico
Comparação entre IA e sonhos humanos
- A forma como a IA gera e expande cenários com base em um modelo da realidade pode ser semelhante aos sonhos
- Fica a dúvida se seria possível "acordá-la" adicionando entrada em tempo real aos LLMs