- No Vale do Silício, vem se espalhando uma cultura que acredita na AGI (inteligência artificial geral) como um objetivo viável
- Dentro da OpenAI, formou-se a crença, baseada na “hipótese da linguagem pura”, de que a expansão dos modelos de linguagem pode levar à AGI
- Essa crença serve como justificativa para a expansão massiva de data centers e para problemas de exploração ambiental e trabalhista
- A lógica de valor esperado (Expected Value) da AGI depende de estimativas infundadas de probabilidade e valor, ignorando os danos ambientais reais e os custos sociais
- É necessário abandonar a fantasia da AGI e adotar uma abordagem prática de engenharia que resolva problemas com modelos pequenos e orientados a objetivos
A crença na AGI e a cultura da OpenAI
- Pessoas ligadas à OpenAI realmente acreditam que a AGI pode trazer prosperidade ou destruição para a humanidade
- Elon Musk descreveu Demis Hassabis como um “vilão tentando dominar o mundo”, definindo a OpenAI como o “bem” e a DeepMind como o “mal”
- Ilya Sutskever dizia aos funcionários “Feel the AGI” e realizou um ritual de queimar um boneco de madeira que simbolizava a AGI
- Essas ações mostram que a imaginação de ficção científica se estabeleceu como uma crença dominante no Vale do Silício
A “hipótese da linguagem pura” e a expansão dos LLMs
- Segundo o livro Empire of AI, de Karen Hao, o GPT-2 se baseava na “hipótese da linguagem pura (pure language hypothesis)”
- Como os humanos pensam e se comunicam por meio da linguagem, parte-se da premissa de que a AGI seria possível apenas com dados de linguagem
- Em contraste, a “hipótese de grounding (grounding hypothesis)” defende que a AGI precisa perceber o mundo
- A expansão bem-sucedida de GPT para GPT-2 reforçou dentro da OpenAI a crença de que, com mais dados, mais parâmetros de modelo e mais recursos computacionais, seria possível chegar à AGI
Corrida por escala e problemas ambientais e trabalhistas
- A crença na AGI e os resultados dos LLMs justificam a construção de data centers em larga escala
- Algumas instalações usam centenas de litros de água por segundo e operam geradores a gás poluentes por causa da falta de energia elétrica
- Isso leva a consumo de energia no nível de uma cidade inteira e a aumento das emissões de CO₂
- Para garantir saídas seguras do ChatGPT, trabalhadores que fazem censura e limpeza de dados sofrem com exploração e trauma psicológico
- Com o aumento da demanda por dados, faz-se a coleta indiscriminada da internet inteira e controla-se o resultado com RLHF (Reinforcement Learning from Human Feedback)
O problema da lógica de valor esperado
- Valor esperado (Expected Value) é frequentemente citado como justificativa para o desenvolvimento de AGI
- A lógica é: “mesmo que haja 0,001% de chance de gerar um valor enorme, o EV ainda é muito alto”
- No entanto, esses cálculos dependem de probabilidades e valores arbitrários e impossíveis de verificar
- Em contrapartida, a destruição ambiental e os custos sociais existem como valor negativo certo e dano presente
Mudança para a engenharia real
- Engenheiros devem resolver problemas de forma eficaz, eficiente e sem causar danos
- A abordagem que trata LLMs como AGI falha nos três critérios
- Ela gera desperdício excessivo de computação, exploração do trabalho e danos ambientais
- É preciso deixar para trás a fantasia da AGI e avaliar LLMs e modelos generativos como ferramentas para resolver problemas específicos
- Uso de modelos generativos pequenos e orientados a objetivos ou modelos não generativos (discriminativos)
- Necessidade de engenharia prática por meio de análise de custo-benefício e trade-offs técnicos
3 comentários
Comentários do Hacker News
Se eu fosse dar um conselho aos céticos de IA, diria para evitar a discussão sobre uso de água de datacenters
Expressões como “milhões de litros por ano” soam assustadoras sem contexto, mas, comparadas à agricultura ou a campos de golfe, são insignificantes
Discussões sobre consumo de energia e emissões de CO₂ são válidas, mas enfatizar só a água acaba enfraquecendo a credibilidade do argumento como um todo
Mas depois descobri que datacenters frequentemente usam água potável que não pode ser usada na agricultura
Ainda assim, acho que apresentar números como “milhões de galões” sem contexto continua sendo um anti-padrão
Isso parece o resultado de uma discussão técnica ter se transformado em política identitária
No HN, deveríamos deixar de lado posicionamentos políticos e debater com base em fundamentos técnicos
Provavelmente essa postura surgiu como reação à propaganda exagerada de IA
argumentou que, pelo contrário, quando surge demanda em grande escala, a infraestrutura hídrica local pode ser expandida e o preço da água potável pode cair
Segundo sua opinião adicional, a crítica de que “a IA usa apenas água valiosa” na verdade inverte a situação
Houve um caso em que um datacenter do Google, em uma cidade do Chile, agravou a seca local,
e em outras regiões a situação era tão séria que chegaram a misturar água do mar à água potável
Acho claramente problemático usar um volume de água comparável ao consumo de uma cidade inteira
Tanto campos de golfe quanto datacenters devem pagar seus custos externos,
e, se forem antieconômicos em regiões secas, acho isso preferível
Se a água pode ser usada na agricultura, também pode ser usada no resfriamento
A questão do consumo de energia também tem certo exagero — no fim, a energia renovável barata será a mais competitiva
Acho que a limitação dos LLMs é um problema de hardware
Os neurônios do cérebro humano processam milhares de entradas e saídas ao mesmo tempo, mas os neurônios de LLM têm apenas uma única entrada e saída
O cérebro humano opera com cerca de 20W, mas LLMs precisam de vários MW
É difícil chegar à AGI com GPUs ou TPUs, e será necessário um paradigma de hardware completamente novo
Não é simplesmente uma questão de falta de capacidade computacional
Em um ambiente voltado apenas à atividade intelectual, talvez não sejam necessários tantos neurônios
O problema não é a escala, mas a estrutura de disposição (Electronic Design Automation)
Veja o artigo da Wikipédia sobre EDA
O cérebro tem vários caminhos de entrada e diferentes formas de sinalização, e a complexidade de projeto é muito maior
O discurso sobre AGI parece uma extensão de um impulso religioso
Os seres humanos ainda desejam uma resposta absoluta que resolva todos os problemas
Se for reprimida, volta de formas piores
Meditação, moderação e ética em relação aos outros são a minha “religião” pessoal
É uma tentativa de reproduzir por tecnologia sistemas naturais como o sol ou o cérebro
Como na religião, estruturas de poder usam crenças para manter o controle
A fé cega e a fraude humanas se repetem em qualquer época
Referência: Extraordinary Popular Delusions and the Madness of Crowds
Uma sociedade em que a religião desaparece primeiro passa por uma fase de casca vazia com apenas valores remanescentes,
e depois cai em uma fase de não religião em que surge um vazio moral
Alguns tentam se submeter à IA, mas “porque a IA disse” é uma fé sem inspiração
Como técnico, eu também quero uma resolução de problemas eficiente e inofensiva, mas a realidade é complexa
Eu estava configurando Bluetooth em um Raspberry Pi e consegui resolver com a ajuda do GPT e do Claude
Stack Overflow e fóruns não estão mais tão ativos quanto antes, e a documentação está espalhada
A tecnologia ficou complexa demais, a ponto de acabarmos tendo que depender de LLMs
mas, no longo prazo, uma sociedade impossível de manter sem IA não pode ser sustentável
A tecnologia precisa voltar à simplicidade
Veja, por exemplo, ArchWiki Bluetooth ou Debian BluetoothUser
Já está surgindo nas empresas uma estrutura em que agentes de IA executam ferramentas no lugar das pessoas
No fim, há um grande risco de que humanos deixem de entender a lógica interna
Mas ainda têm limitações fundamentais para substituir completamente seres humanos
No fim, é bem possível que os LLMs sigam o mesmo caminho
Parte do setor afirma que LLMs são um beco sem saída fundamental,
mas, por estarem presos a ações e reputação, não admitem a realidade
LLMs também podem ser uma tecnologia intermediária rumo à AGI
Pode até se tornar um componente central de sistemas de AGI
Graças ao Whisper, meu trabalho com legendas de vídeo foi drasticamente encurtado
O que antes levava horas agora termina em minutos
Com o MacWhisper, que tem uma boa interface, a acessibilidade também aumentou
Por exemplo, há casos em que advogados usam LLMs para encontrar materiais que provam inocência
Mais importante do que expansão excessiva é o uso prático
Em poucos anos, chegaremos a uma era em que LLMs pessoais rodarão em nível de notebook
Acho exagerado dizer que moderadores de conteúdo estão sendo explorados
Esse é um trabalho de moderação da internet que existe há 30 anos
Pode ser desagradável, mas não é algo novo nem horrível
É uma função necessária, independentemente da busca por AGI
É bom ver uma discussão realista sobre IA
Não é que a tecnologia dos transformers em si seja inútil,
o problema é o exagero excessivo de que “a AGI está chegando em breve”
O HN resistiu bem à maioria dos modismos, mas desta vez parece uma exceção
Devemos enfrentar isso não porque é fácil, mas porque é difícil
Mesmo que AGI seja uma fantasia, no processo problemas úteis podem ser resolvidos
As emissões de carbono de datacenters são em grande parte exageradas,
e, no longo prazo, datacenters movidos a energia limpa serão mais econômicos
Isso é um peso direto para a população de baixa renda
A IA atual ainda não é convincente nesse ponto
DeepMind e Demis Hassabis estão de fato produzindo resultados científicos
Ex.: AlphaFold, AlphaEvolve etc.
Diante de pesquisas assim, é injusto simplesmente dizer que “IA é fantasia”
O ponto do texto é criticar a obsessão com AGI
Hassabis parece realmente interessado no avanço da ciência
Já algumas empresas parecem mais próximas de PR para ganhar dinheiro
Todo mundo falando de AGI, mas no fim cada um só está dizendo o que fez.
Em vez de trazer coisas estranhas sobre engenharia, como questões de exploração ambiental e trabalhista,
acho que seria melhor soltar um relatório dizendo logo que vai quebrar e mostrar atitude entrando vendido...