21 pontos por GN⁺ 2025-02-24 | 2 comentários | Compartilhar no WhatsApp
  • Nos últimos anos, o debate sobre AGI (Artificial General Intelligence, inteligência artificial geral) cresceu rapidamente
  • A definição exata de AGI é incerta e muito controversa, e estabelecer uma timeline de AGI virou uma forma comum de discussão
    • "Timeline longa": a visão de que a AGI chegará em 10 a 20 anos
    • "Timeline curta": a afirmação de que a AGI surgirá em breve
  • Mas discutir o avanço da IA dessa forma é ineficiente
    • É mais apropriado ver isso não como uma jornada rumo ao destino final chamado AGI, mas como um processo de aumento da produtividade da IA
    • A IA está evoluindo para conseguir realizar mais tarefas com menos intervenção humana
      • Ex.: rotulagem de dados, escrita de código, resolução de problemas matemáticos, direção autônoma, voo automático etc.
    • No entanto, é incerto se a IA chegará a um ponto em que funcionará para sempre sem intervenção humana
    • Devemos medir quanto valor a IA consegue gerar em relação ao input recebido
  • O avanço da IA pode ser visto como o aumento do valor econômico produzido pela IA em relação ao esforço humano investido
  • Perguntas importantes:
    • A IA poderá evoluir indefinidamente e gerar valor econômico sem intervenção humana?
    • Ou chegará a um ponto de limite técnico?
  • Se a IA conseguir gerar valor econômico completamente sem intervenção humana, isso também pode ter consequências bastante perigosas

Já vimos esse fenômeno antes (carros autônomos)

  • No setor de IA, antes do boom dos modelos de linguagem, houve por volta de 2017 uma febre dos carros autônomos
    • Na época, várias empresas declararam que lançariam carros com direção totalmente autônoma (Full Self-Driving, FSD) em até um ano e atraíram investimentos de bilhões de dólares
    • Milhões de milhas foram percorridas, muitas empresas foram criadas, mas algumas acabaram falindo
  • A FSD completa ainda não se concretizou
    • A Tesla ainda não consegue direção totalmente autônoma, e a Waymo só consegue operar parcialmente em áreas específicas previamente mapeadas
    • Ainda é necessária intervenção humana ocasional

Previsão de 2016 de Elon Musk, CEO da Tesla:
"Ainda este ano, um Tesla dirigirá de Los Angeles até Nova York de forma totalmente autônoma."
→ Mas isso ainda não se concretizou até 2024 (a Tesla continua vendendo a opção de assinatura "Full Self-Driving")

  • Agora, em vez de discutir se a direção autônoma será totalmente possível, uma abordagem mais realista passou a ser medir "milhas por intervenção" (miles-per-intervention)
    • Ou seja, medir quão longe o carro consegue rodar sem nenhuma intervenção humana
  • Segundo relatórios recentes, a Tesla precisa, em média, de uma intervenção humana a cada 13 milhas
    • Com modelos de IA maiores, inferência mais rápida, mais dados e engenharia aprimorada, esse número tende a aumentar
    • Mas ainda é incerto se, com a tecnologia atual, esse número pode crescer ao infinito
  • Em outras palavras, ainda não sabemos se os modelos de direção autônoma vão evoluir indefinidamente até tornar a intervenção humana totalmente desnecessária, ou se vão atingir um limite em algum ponto

Por que Yann LeCun estava errado (em parte)

  • Yann LeCun, cientista-chefe de IA da Meta, argumentou no passado que modelos de linguagem não poderiam alcançar inteligência de nível humano
  • O motivo: modelos de linguagem geram saídas token por token, e existe uma probabilidade de erro em cada token; a lógica era que, com o acúmulo desses erros, o desempenho inevitavelmente se degradaria
  • Ele via esse problema de acúmulo de erros como uma limitação fatal dos modelos de linguagem e defendia que, para resolvê-lo, seria preciso abandonar a abordagem autoregressiva (autoregressive) atual
  • Porém, a realidade foi diferente
    • Sistemas de IA recentes (OpenAI o1/o3, DeepSeek R1 etc.) contradizem diretamente essa hipótese
    • Eles continuam sendo autoregressivos, mas, quanto mais longas as saídas que geram, melhor tende a ser o desempenho
    • Na pesquisa sobre o DeepSeek R1, apareceu um padrão em que, quanto mais tempo o modelo "pensa", maior a probabilidade de chegar à resposta correta

      O gráfico do relatório do DeepSeek R1 mostra melhora de desempenho à medida que o modelo gera saídas mais longas → isso entra em choque direto com a hipótese de Yann LeCun

  • Como os modelos corrigem seus próprios erros
    • A lógica anterior partia da suposição de que os erros inevitavelmente se acumulam no nível do token
    • Mas pesquisas recentes mostram que os modelos possuem mecanismos para corrigir erros por conta própria
    • Por exemplo, quando certos padrões de tokens são gerados, observa-se uma tendência probabilística de encontrar respostas melhores no meio do processo

      Exemplo do DeepSeek R1: o processo pelo qual o modelo encontra uma "resposta melhor" em determinado ponto → justamente o que Yann LeCun dizia ser impossível

  • Atualmente, alguns pesquisadores estão analisando esse mecanismo de autocorreção (self-correction) e estudando como induzi-lo de forma mais eficaz
  • Ainda assim, permanece incerto se essa abordagem só vale para certos tipos de problema, como programação e matemática

Por que Yann LeCun estava certo (em parte)

  • A hipótese de Yann LeCun não estava completamente errada
  • Embora pesquisas recentes contestem sua hipótese de "acúmulo de erros", ainda continua sendo verdade que modelos de linguagem não conseguem gerar saídas infinitamente precisas
  • Ou seja, a IA não pode operar de forma independente para sempre
  • O limite dos agentes totalmente autônomos (FAA)
    • Muitos pesquisadores tentam desenvolver agentes de IA capazes de executar tarefas por longos períodos
    • Mas isso apresenta um problema semelhante ao de desenvolver carros com direção totalmente autônoma (FSD)
    • Em outras palavras, com a stack tecnológica atual, sistemas de IA completamente autônomos podem ser inviáveis
  • A importância do input humano
    • As informações mais confiáveis vêm de prompts inseridos diretamente por humanos
    • A IA pode obter dados adicionais por meio de algumas ferramentas (por exemplo, consulta de voos, previsão do tempo etc.), mas gerar saídas longas indiscriminadamente não faz a probabilidade de acerto crescer ao infinito
    • É pouco provável que a IA consiga gerar saídas infinitamente úteis sem intervenção humana

Por que devemos evitar o debate sobre AGI na pesquisa em IA

  • Medir o progresso dos modelos de linguagem por uma timeline de AGI é a abordagem errada
  • A pergunta melhor deveria ser: "Por quanto tempo a IA consegue trabalhar de forma eficaz sem intervenção humana?"
  • Assim como na direção autônoma se mede "milhas por intervenção", para modelos de linguagem também é mais prático medir "por quanto tempo conseguem gerar saídas corretas sem intervenção humana"
  • Em vez de esperar por uma IA que funcione completamente sem intervenção humana (FAA, Fully Autonomous Agent), é importante reconhecer o processo contínuo de avanço atual, de "aumento da quantidade de trabalho útil feita pela IA"
  • Mesmo sem AGI completa, o valor econômico oferecido pela tecnologia atual já é suficientemente significativo
  • Portanto, é mais desejável melhorar a produtividade real da IA do que discutir quando a AGI será alcançada

2 comentários

 
princox 2025-02-27

"A IA nunca poderá operar de forma independente para sempre"

Essa parte é impressionante.

 
GN⁺ 2025-02-24
Comentários do Hacker News
  • Satya Nadella comentou sobre AGI

    • Mais importante do que a receita da Microsoft é moderar o hype excessivo em torno da AGI
    • A taxa de crescimento econômico dos países desenvolvidos é de apenas 2% e, considerando a inflação, é quase 0%
    • Em 2025 haverá desafios para o crescimento econômico
    • É preciso alcançar um crescimento comparável ao da Revolução Industrial
    • Quem sairá vencedor serão as indústrias que utilizarem AGI, não as empresas de tecnologia em si
    • Quando a produtividade aumenta e a economia cresce rapidamente, a indústria também se desenvolve
    • Não faz sentido se vangloriar dos resultados da AGI; o verdadeiro critério é a economia mundial crescer 10%
  • É importante encontrar maneiras de oferecer trabalho às pessoas

    • A mudança de marketing de AGI para ASI é uma armadilha
    • Apesar das críticas à economia "gig", muitas pessoas estão vivendo melhor por meio de Uber e DoorDash
    • Uber e DoorDash têm valor no dia a dia
    • Dá-se gorjeta aos entregadores para que possam ganhar mais do que o salário mínimo
    • Nem todo mundo pode se tornar engenheiro de software autodidata ou empreendedor
    • É importante oferecer trabalho às pessoas
  • Cresce o ceticismo em relação ao "raciocínio" dos LLMs

    • Pelos resultados do DeepSeek e do Grok, foi possível ver as limitações dos LLMs
    • Há casos em que o modelo cai em caminhos ineficientes ou errados
    • Por exemplo, o Grok 3 passou 10 minutos verificando repetidamente o nome de uma carta específica
    • Há casos em que o modelo entra em um comportamento improdutivo auto-reforçado
  • Discussão sobre carros autônomos

    • A Tesla ainda não é capaz de direção totalmente autônoma, e a Waymo só consegue isso em regiões específicas
    • Alguns sistemas de IA melhoram ao gerar saídas mais longas
    • Porém, saídas longas não tornam necessariamente o modelo melhor
    • O argumento de LeCun aponta o problema de acúmulo de erros nos modelos de linguagem
  • Expectativas excessivas sobre AGI e robôs humanoides

    • É preciso focar no benefício econômico mais do que na AGI
    • O objetivo da AGI é superar 99,99% dos humanos
  • As expectativas das pessoas em relação à AGI

    • As pessoas querem algo diferente de AGI
    • Se a AGI tiver autonomia, ela se tornará incontrolável
    • As pessoas querem especialistas tecnicamente brilhantes, mas que sigam instruções
  • O sucesso dos modelos de difusão de linguagem

    • Usa-se uma estratégia de remasking para resolver o problema de acúmulo de erros
    • Houve sucesso em prever vários tokens ao mesmo tempo
  • Perguntas sobre o valor econômico da IA

    • Quando a IA aumenta a produtividade humana, para quem será transferido o valor econômico
    • Se o emprego humano diminuir, será necessário um plano para a distribuição do valor econômico
  • Comparação entre IA e sonhos humanos

    • A forma como a IA gera e expande cenários com base em um modelo da realidade pode ser semelhante aos sonhos
    • Fica a dúvida se seria possível "acordá-la" adicionando entrada em tempo real aos LLMs