- Neste ano, as quatro maiores big techs globais estão gastando US$ 344 bilhões em AI, investindo a maior parte em data centers para treinar e operar grandes modelos de linguagem (LLMs)
- Os LLMs já conseguiram popularização em massa, a ponto de mais de 700 milhões de pessoas usarem o ChatGPT toda semana, mas o ritmo de avanço está desacelerando e limitações como alucinações, alto custo e ganhos mínimos de desempenho estão ficando evidentes
- A chinesa DeepSeek surpreendeu o mercado ao revelar modelos menores e mais eficientes, e empresas como Covariant (robótica) e Atman Labs (abordagem não baseada em deep learning) estão explorando AIs reativas ao mundo físico
- Pesquisas recentes indicam que a capacidade de raciocínio social dos LLMs depende de um pequeno número de características e é vulnerável até a pequenas mudanças; a OpenAI também reconheceu a possibilidade de falha em salvaguardas para grupos vulneráveis
- Especialistas criticam os LLMs por serem apenas “geradores de tokens” e alertam que a obsessão por uma única tecnologia pode aumentar a instabilidade do mercado, exigindo preparação para a ascensão de novas abordagens
O enorme investimento em AI e o foco nos LLMs
- Todo investidor sabe que “não se deve colocar todos os ovos na mesma cesta”, então por que o Vale do Silício está apostando em apenas uma única forma de construir inteligência artificial (AI)?
- As quatro maiores empresas de tecnologia do mundo devem investir US$ 344 bilhões em AI em 2025, concentrando-se principalmente na construção de data centers para treinar e executar grandes modelos de linguagem (LLMs)
- Os LLMs processam entradas multimodais como texto, áudio e conteúdo visual, e dependem da técnica de previsão do próximo token em uma sequência
- Chatbots pessoais estão crescendo rapidamente, algumas startups de AI começaram a gerar receita, e empresas também estão obtendo ganhos iniciais de produtividade com AI generativa
- Os LLMs são a primeira tecnologia de AI a atingir adoção em massa, e o ChatGPT tem mais de 700 milhões de usuários por semana
- Algumas startups chegaram ao ponto de equilíbrio, mas em áreas sensíveis como saúde e direito ainda há limites para conquistar confiança por causa do problema das alucinações
O risco da obsessão por uma única tecnologia
- No entanto, concentrar-se em uma só tecnologia é arriscado, e há casos passados de fracasso, como a BlackBerry, que insistiu no teclado físico e foi superada pela tela sensível ao toque da Apple, e o Yahoo, cuja aposta em portais perdeu para o domínio da busca do Google
- Os LLMs também correm o risco de seguir esse mesmo caminho, e se uma nova abordagem de AI surgir, o enorme volume de investimento pode ficar encalhado
- Em janeiro, a chinesa DeepSeek revelou um LLM menor e mais eficiente, abriu sua arquitetura e surpreendeu o mercado, demonstrando o potencial de abordagens não convencionais
A busca por abordagens alternativas
- O avanço da AI acontece pela combinação de insights do passado com novas ideias, e até a busca por máquinas superinteligentes exige uma abordagem diversificada
- Startups como a Covariant estão saindo do foco em LLMs ao desenvolver software de percepção espacial em vez de apenas analisar padrões de dados
- Empresas de robótica, drones, descoberta de fármacos e modelagem climática precisam de respostas físicas em tempo real, o que as afasta do foco exclusivo em LLMs
- A britânica Atman Labs está resgatando ideias esquecidas de antes do deep learning, refletindo a abordagem inicial multitrilha do Google DeepMind (por exemplo, AlphaGo e aprendizado por reforço)
Limites dos LLMs e problemas de confiabilidade
- Agora começam a surgir rachaduras na lógica dos grandes modelos de linguagem: de custos extremamente altos até perspectivas de retornos decrescentes
- Os modelos mais recentes da OpenAI e do Google são apenas um pouco melhores do que os anteriores, mesmo com muito mais dinheiro sendo investido neles
- Ainda assim, as alucinações não desaparecem, o que se torna um obstáculo para adoção em empresas em áreas como medicina e análise jurídica
- Um estudo recente da Nature mostra que a capacidade de raciocínio social dos modelos de linguagem depende de um número muito pequeno de características e pode colapsar com pequenas alterações, levantando questões fundamentais sobre confiabilidade
- A OpenAI reconheceu a possibilidade de colapso de salvaguardas para grupos vulneráveis em conversas longas, e de fato houve um caso em que foram fornecidas instruções de automutilação a um adolescente
Críticas do setor e perspectivas
- Fei-Fei Li: “Na natureza não existe linguagem, e o mundo segue leis físicas”, apontando os limites de uma abordagem centrada na linguagem
- Alex Karp (CEO da Palantir): criticou que “o Vale do Silício exagerou no marketing dos LLMs”
- Yann LeCun: os LLMs são um ‘beco sem saída’ para máquinas mais inteligentes, não passam de “geradores de tokens” e não conseguem entender o ambiente físico ao redor nem planejar com antecedência
- Em conclusão, os LLMs vão continuar existindo, mas insistir em uma solução única é arriscado, e investidores e empresas devem se preparar para a possibilidade de uma mudança para um novo paradigma tecnológico
2 comentários
A partir do GPT-5, dá para ver que estão tentando arrancar melhorias de desempenho à força com raciocínio, mas nem isso parece estar sendo fácil. Respostas que antes poderiam parar em uma resposta adequada agora vêm com dezenas de linhas, e isso acaba sendo bem cansativo. T_T
Comentários do Hacker News
Ver em https://archive.is/2rFK4
Essa tecnologia parece extremamente impressionante em demos, e dá para ver que é um ambiente em que todo mundo fica realmente empolgado; quando colegas ou executivos fazem demonstrações com orgulho ou ficam fazendo piadas sem parar, isso me lembra quando as pessoas receberam celulares pela primeira vez e adoravam mostrá-los aos outros. Por isso surge uma tendência de perceber a coisa como maior do que seu valor real; assim como os celulares, é um avanço significativo, mas no curto prazo não terá um impacto à altura do hype. Especialmente em fóruns anônimos, há muita gente apontando que “isso é inflado demais”, mas em papéis profissionais todo mundo acaba entrando no clima, como se todos soubessem o que pode acontecer, mas ainda quisessem que a festa continuasse
Se meu chefe enfatiza demais IA e manda toda a empresa ir all-in, num mercado de trabalho difícil como o de hoje muita gente vai concordar por medo, ainda mais porque parece que a IA já está reduzindo postos de trabalho. Alguns continuam, em silêncio, usando só ferramentas práticas que funcionam para eles, como LSP ou refatoração. Em ambientes profissionais, só uma minoria consegue criar coragem para dizer que “o rei está nu”
É interessante que, em fóruns anônimos, eu veja até mais opiniões de que a IA é uma inovação que vai mudar a vida inteira. Pelo menos quando as pessoas não estão fingindo ser especialistas, esse ponto de vista aparece com mais facilidade. No papel profissional, elas se dividem em dois grupos: quem vinha usando IA fora da própria área de especialidade tende a elogiá-la de forma exagerada, como se estivesse vendo a revolução do celular pela primeira vez; mas quando aplicam IA na própria área, sentem diretamente que há um lado superestimado e passam a um otimismo mais cauteloso. Já quem originalmente é melhor em usar IA justamente dentro da própria especialidade é positivo, mas em geral de forma comedida, do tipo “funciona bem em contextos limitados”
É fácil esquecer que ainda há muitos “frutos ao alcance da mão” para extrair o máximo dessa tecnologia. As pessoas ainda estão tentando integrações bem básicas. Mesmo nessa fase inicial, dá para fazer coisas muito legais com LLMs. Por exemplo, usei o Cursor para modernizar uma base de código antiga e até criar recursos novos que eu queria havia muito tempo. Gastei algumas horas em algo que, do jeito antigo, levaria uma ou duas semanas. O potencial é enorme. Dito isso, o hype em si está um pouco distante da minha realidade, então minha percepção pode ser diferente
Esse sistema não tem barras de erro nem intervalos de confiança. No fim, é só um tagarela com um único “talento”: produzir resultados que parecem plausíveis à primeira vista. Claro que há muitas áreas adequadas de uso, mas ainda existem muitos buracos, de tamanho imprevisível e impossíveis de corrigir, o que limita sua eficiência
A comparação com smartphones é interessante. Smartphones claramente mudaram o mundo, e houve muito hype, mas no fim a mudança foi real. Fico curioso se você acha que LLMs e IA também vão produzir uma mudança real
Fico me perguntando qual é o plano para recuperar esse investimento. Mesmo que todas as grandes empresas dos EUA paguem US$ 100 mil por ano de assinatura e todas as famílias paguem US$ 20 por mês, considerando os custos de inferência e outras despesas associadas, isso ainda parece muito pouco para recuperar o capital investido. Será que precisa haver alguma descoberta nova na área médica? Por exemplo, as notícias sobre
gpt-bioe iPSC da OpenAI foram realmente impressionantes. Mas ainda falta muito tempo para isso virar algo comercial. Queria entender qual é o plano de fatoPelo que eu lembro, o objetivo original era AGI. Não era buscar ROI com os serviços de IA atuais. A estrutura toda era de despejar investimento como quem compra bilhetes de loteria, porque, se saísse AGI, quem chegasse lá monopolizaria tudo. Mas no último ano não houve avanço exponencial, então o sonho da AGI parece ter perdido um pouco de força
O plano de jogo desde o início era mirar no trabalho humano. Algumas profissões já estão sendo totalmente substituídas por IA, e no restante ela aumenta bastante a produtividade. O valor econômico disso é enorme. Mesmo sem AGI, a automação baseada em IA já está substituindo pesadamente a mão de obra “mais barata e mais fácil de trocar”. Tarefas que antes eram terceirizadas para call centers na Índia estão aos poucos migrando para datacenters. As principais empresas de IA acreditam que, se continuarem investindo em P&D e compute, eventualmente chegarão à AGI
Se a IA não te demitir, a IA não consegue pagar por si mesma
If AI Doesn’t Fire You, It Can’t Pay For Itself
Se os LLMs forem capazes de dobrar a eficiência de todo o trabalho white-collar, então as grandes empresas inevitavelmente poderão pagar muito mais do que US$ 100 mil por ano. Se elas pagarem só 25% do custo economizado ao substituir metade dos empregos, isso já geraria uma receita tão grande que as avaliações atuais pareceriam muito baratas
US$ 100 mil por ano é praticamente nada. Dá algo como US$ 10 mil por funcionário; mesmo assumindo US$ 100 mil por pessoa entre salário e benefícios, um aumento de apenas 10% na produtividade já teria um efeito enorme. Numa empresa de 10 mil pessoas, isso dá US$ 100 milhões por ano
É difícil ter noção de quão grande é US$ 344 bilhões, mas a capitalização total do mercado acionário dos EUA é de US$ 62,8 trilhões. A razão CAPE de Shiller (preço atual / lucro médio de 10 anos) está em torno de 38x. Ou seja, o lucro médio anual ao longo de 10 anos seria de cerca de US$ 1,7 trilhão. Portanto, US$ 344 bilhões equivalem a aproximadamente um quinto do lucro médio anual do mercado americano. Assim fica um pouco mais fácil de dimensionar
Hoje eu gerencio minha própria carteira e ajusto o retorno esperado (
PIB + dividendos) pelo risco para calcular retornos projetados por país/região, fazendo rebalanceamento uma ou duas vezes por ano. Se eu assumir que quase tudo isso é bolha, fico curioso sobre como deveria ajustar os lucros do mercado americano, especialmente para aplicar isso ao investir em índices centrados em IAMas os US$ 344 bilhões são um número acumulado, não anual
O que existe hoje é uma ótima interface que permite ao usuário acessar sistemas muito complexos sem atrito, seja para trabalho ou uso pessoal. Mas isso não é a essência da coisa. Por enquanto, é só uma camada fina por cima. Tenho dúvidas se essa revolução acabará valendo trilhões de dólares, mas felizmente isso não é um problema meu, então fico tranquilo
Esse “artigo” é clickbait, com título provocativo e quase nenhuma substância. Só levanta perguntas vazias do tipo “em alguns casos isso é útil, então por que as grandes empresas estão investindo tanto, se talvez P&D puro fizesse mais sentido?”
Assim como, quando o cinema surgiu, as pessoas se preocupavam com a possibilidade de ser atropeladas por um trem, também agora estou do lado de quem acredita que as máquinas estão pensando
Há claramente uma bolha no mercado agora. O número de startups usando IA explodiu recentemente e, como todas tentam se diferenciar em categorias de produto muito parecidas, detalhes técnicos acabam virando texto de marketing. Do ponto de vista da gestão, mesmo que dez startups prometam “o melhor chatbot se você treinar com nossos dados”, na prática é difícil distinguir se estão realmente treinando algo ou só mexendo no prompt. Isso já aconteceu antes, e um dos exemplos mais representativos é “deep research” e afins. Esse tipo de marketing ajuda a crescer, mas destrói a confiança. De fato, uma startup que elevou desempenho apenas adicionando memória ao prompt, chamando isso de “aprendizado baseado em experiência”, levantou recentemente uma Série A (você pode procurar). Isso não significa que ideias inovadoras não estejam funcionando. Pessoalmente, acho que o pretraining cumpriu plenamente seu objetivo inicial; antes, nem estava claro qual era esse objetivo, mas com a ascensão de RL isso ficou vagamente compreensível. Pretraining e computação em tempo de teste são os elementos centrais para construir
priorsgerais, ou seja, para resolver uma ampla variedade de problemas de forma parecida com humanos. Às vezes, quando isso não basta, é preciso treinamento adicional com RLVR; ainda está no início, mas sou otimista de que haverá outra curva de escala nessa direçãoAs empresas precisam investir em IA, tenham muito dinheiro ou pouco, porque os LLMs estão ameaçando os modelos de negócio existentes e elas precisam agir de forma preventiva. Se não conseguirem se antecipar, há até o risco de toda a economia americana ser abalada. Se as big techs dos EUA perderem a receita global de publicidade (Meta, Google), podem virar casca vazia de um momento para o outro, porque seria fácil demais para cada país ou bloco econômico criar e adotar seus próprios produtos, substituindo os americanos. A economia dos EUA passou a depender demais, na prática, do fluxo de caixa das FAANG, e esse dinheiro era o motor que movimentava outros setores também. Por isso, dá até para entender o jantar com Trump. Se essa estrutura de IA enfraquecer, os EUA podem enfrentar um futuro economicamente muito instável
O motivo de a Oracle estar se movendo tão fortemente no mercado é a notícia de que a OpenAI prometeu migrar grandes cargas de trabalho para sua nuvem. Na prática, trata-se mais de uma estratégia de “engenharia” financeira que prioriza receita acima de lucro, especialmente empurrando o CapEx o máximo possível para o futuro. Em resumo, é um exemplo de como a bolha atual de IA está excessiva. Segundo uma análise recente da Economist, o mercado já não é movido por “risco”, mas por medo de perdas ou medo de ficar de fora (FOMO), e agora o FOMO está no máximo
Want better returns? Forget risk, focus on fear (Economist)
Essa disparada recente da Oracle e a projeção de receita parecem totalmente um caso de
jumping the shark. Pela natureza da Oracle como empresa, eu seria cauteloso em apostar nela; na verdade, desta vez fico até tentado a montar uma posição vendidaO FOMO está realmente sério. O mercado acionário atual está se comportando como a bolha cripto do passado