12 pontos por GN⁺ 2025-08-22 | 1 comentários | Compartilhar no WhatsApp
  • Segundo um relatório do MIT, 95% das empresas no mundo não obtiveram retorno real com a adoção de IA generativa
  • As empresas testaram em larga escala grandes modelos de linguagem como ChatGPT e Copilot, mas a maior parte do uso ficou restrita ao aumento de produtividade
  • Casos de sucesso foram observados em apenas 5% dos pilotos de IA integrados, e na maioria dos casos não houve impacto em receita ou lucro
  • O principal motivo é que a IA generativa não se encaixa bem nos processos reais de trabalho, não consegue reter feedback nem se adaptar ao contexto
  • O relatório rejeita preocupações com substituição massiva de empregos e avalia que é possível reduzir custos externos, mas reestruturações internas ou demissões em massa ainda são pouco realistas no curto prazo
  • Em resumo, a IA tem força em tarefas específicas, não como estratégia ampla, e as empresas devem focar em áreas limitadas com resultados imediatos, em vez de buscar inovação em toda a organização

Investimento das empresas em IA generativa e retorno

  • Nos últimos 3 anos, as empresas investiram US$ 30 a 40 bilhões em projetos de IA generativa
  • No entanto, são pouquíssimas as empresas que obtiveram retorno real de negócio
  • Em um novo estudo do MIT, 95% das empresas responderam que não tiveram ganhos mensuráveis apesar da adoção de IA
  • Apenas 5% dos projetos-piloto de IA estão gerando valor na casa de milhões de dólares

Situação atual da adoção de grandes modelos de linguagem e seus limites

  • Mais de 80% das grandes empresas testaram ou operam em piloto os principais LLMs, como ChatGPT e Copilot
  • Cerca de 40% das empresas adotaram esses sistemas em algum grau, mas a maior parte do uso se limita ao ganho de produtividade individual dos funcionários
  • quase nenhum impacto na melhoria da receita total ou do lucro das empresas

Limites técnicos da IA generativa

  • Ferramentas de IA generativa muitas vezes não se encaixam bem nos processos reais de trabalho
    • Entre os principais problemas apontados estão fluxos de trabalho instáveis, ausência de aprendizado de contexto e integração ineficiente com as tarefas
    Publicidade
  • A maioria dos modelos de IA generativa não consegue preservar feedback anterior e tem dificuldade para transferir aprendizados entre contextos e tarefas
  • Segundo o relatório, a maior parte dos sistemas de GenAI é incapaz de manter feedback, se adaptar ao contexto e melhorar no longo prazo
  • Por causa dessas características, os custos de integração de longo prazo nas empresas aumentam, enquanto a eficiência real continua limitada

Diferença entre expectativa de negócio e realidade

  • Houve grande expectativa e alto volume de investimento em IA generativa, mas isso não se converteu em redução de custos nem em geração de receita relevante
  • Na prática, ela está sendo usada em tarefas limitadas como atendimento ao cliente, marketing e redação de documentos, economizando tempo, mas com pouco efeito direto no aumento de receita

Impacto sobre emprego e estrutura organizacional

  • A preocupação de que a IA generativa leve a uma grande redução de empregos no curto prazo tem pouca base
  • O efeito da IA deve ficar mais em otimização de custos externos, como redução de despesas com terceirização, do que em mudanças na estrutura interna de pessoal
  • Em vez de substituir imediatamente grandes contingentes de trabalhadores, o mais provável é que ela reduza custos de outsourcing
Publicidade

Equívocos técnicos e limites de evolução

  • Muitas empresas fracassaram por não compreender com precisão as capacidades reais e os limites da IA
  • A IA generativa pode criar texto ou código rapidamente, mas não tem aprendizado contínuo nem flexibilidade comparáveis aos de um humano
  • Por exemplo, um funcionário consegue se adaptar de forma dinâmica a erros anteriores ou a novas exigências, mas a IA não consegue fazer esse tipo de transferência contínua de memória

Investimento e direção futura

  • Investidores e executivos esperam avanços contínuos na tecnologia de IA, mas no curto prazo o progresso está mais lento do que o esperado
  • O relatório sugere que ainda é cedo para implementar IA imediatamente em todos os setores e fluxos de trabalho
  • As organizações precisam concentrar a adoção em áreas estreitas com efeito imediato e mensurável
    • Ex.: automação de suporte ao cliente, ferramentas de apoio ao desenvolvimento, elaboração de rascunhos de documentos
  • A integração de IA em toda a empresa ainda envolve alto risco e grande chance de fracasso

Conclusão e implicações

  • A geração de valor empresarial com IA generativa está limitada a alguns poucos casos de sucesso
  • Para a maioria das empresas, ela oferece apenas ajuda modesta em tarefas do dia a dia
  • O relatório enfatiza que as empresas precisam enxergar a IA generativa não como motor central de crescimento, mas como ferramenta limitada
  • As expectativas são altas, mas enquanto os sistemas atuais não conseguirem se adaptar como humanos, será difícil para as empresas obter grandes lucros com IA

1 comentários

 
GN⁺ 2025-08-22
Opiniões do Hacker News
  • Houve uma discussão duplicada esta semana (162 comentários) https://news.ycombinator.com/item?id=44941118 e o relatório-fonte real, que o artigo não vinculou, é https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
  • Dizem que esse relatório é totalmente diferente do conteúdo do artigo, então compartilham alguns pontos: 50% do orçamento fracassado foi usado em marketing e vendas, a IA parece poder automatizar US$ 2,3 trilhões em valor de trabalho, impactando 39 milhões de cargos, e a principal causa do fracasso é a rejeição à adoção de novas ferramentas e a falta de apoio da liderança. Acham que estão chegando rápido demais à conclusão de que a IA não funciona. Não é isso que o relatório diz.
    • Disseram que a "IA automatiza US$ 2,3 trilhões em valor de trabalho, impactando 39 milhões de cargos", mas atualmente o potencial de automação do valor do trabalho nos EUA é de 2,27%. O PIB dos EUA está em US$ 27 trilhões, então a ideia seria otimizar US$ 61 bilhões em valor de trabalho e substituir cerca de 15% da força de trabalho do país para gerar US$ 2,3 trilhões em valor, e há dúvida se essa conta realmente fecha. Também fica a pergunta de quem vai comprar tudo isso, se não forem os trabalhadores. Em 2025, o investimento em IA já passou da metade desse valor. Nessa situação, não sabem como medir "valor do trabalho"; PIB não parece um indicador adequado.
    • A impressão que tive também bate com o relatório. Parte das notícias está apenas empurrando uma narrativa sensacionalista para gerar clique. Estão interpretando mal o conteúdo do relatório. Não é tanto um fracasso da IA, mas sim o fato de que os funcionários não estão adotando bem as ferramentas, ou pelo menos não as ferramentas oferecidas pela empresa. A tal "economia da shadow AI" que eles mencionam também é um problema real. As pessoas estão usando LLMs de assinatura pessoal em vez das ferramentas fornecidas pela empresa. Na nossa universidade, também deram ChatGPT Enterprise para todos os alunos e funcionários, mas ele fica bem atrás das versões mais recentes baseadas em nuvem, como o GPT-5. Por isso, a taxa de adoção e retenção é baixa. Na maioria dos casos de uso, usar a nuvem envolve dados cujo uso não é ilegal, então as restrições não são tão grandes.
    • Essa parte do relatório chamou especialmente a atenção: um advogado de um escritório de médio porte comprou por US$ 50 mil uma ferramenta de análise de contratos para a empresa, mas continua usando ChatGPT no trabalho real. A ferramenta de IA comprada pela empresa faz resumos rígidos demais e é difícil de customizar, enquanto o ChatGPT permite conduzir a conversa e iterar até obter o resultado desejado. Ou seja, paradoxalmente, uma ferramenta de US$ 20 entrega uma satisfação real do usuário muito maior do que uma solução enterprise que custa dezenas de milhares de dólares. É assim que explicam por que muitas empresas acabam do lado errado do divisor do GenAI.
    • O número de 39 milhões de cargos impactados é realmente impressionante. A população economicamente ativa dos EUA é de 163 milhões, então isso significaria que quase um quarto estaria em risco.
    • Sobre o comentário de que "muita gente está tirando rápido demais a conclusão de que IA não presta", compartilharam a famosa frase: "É difícil fazer alguém entender algo quando o salário dessa pessoa depende de ela não entender".
  • Atualmente sou líder de uma equipe de engenharia de IA, então naturalmente a percepção de que a IA gera valor bate com o meu interesse. Na nossa empresa, a adoção de IA já permitiu economizar milhões de dólares. Operamos um grande call center e antes os funcionários escreviam manualmente um resumo de 3 a 5 minutos para cada ligação. Recentemente automatizamos os resumos de chamadas com IA. A qualidade dos resumos melhorou e as pessoas puderam se concentrar em tarefas de maior valor. Não é revolucionário, mas é um ganho real e mensurável de eficiência.
    • Dica: sugerem nem fazer o resumo em si e gerá-lo só quando o material for necessário. O áudio das chamadas pode ser armazenado em Opus a 24Kb/s, o que dá 180KB por minuto, e com um processo de retenção temporária e exclusão isso pode economizar mais alguns milhões por ano.
    • Na nossa empresa usamos Google Meet e Gemini para gerar transcrições de reuniões. Mas o conteúdo real é muito impreciso. Fica confuso quem falou o quê e às vezes até inverte o sentido do que foi dito. Falta contexto e o sistema não entende a terminologia interna da empresa, então na prática é inutilizável.
    • Fico curioso se os agentes de call center realmente acham que os resumos por IA são melhores do que os deles. No meu caso, acho difícil usar isso para resumir reuniões. Parece algo que funciona melhor só em chamadas unidirecionais.
    • Nós também tentamos usar IA para resumir reuniões, mas o resultado foi tão fraco que voltamos a fazer tudo manualmente. Queria saber se houve algum caso concreto em que funcionou bem, ou se teve treinamento/customização específica.
    • Fico me perguntando por que um agente de call center precisava gastar de 3 a 5 minutos para escrever um resumo de toda ligação. Entre os vários casos de uso de IA, vejo com frequência automação de tarefas que na prática nem precisavam existir. Se ninguém lê os relatórios, então a qualidade do resumo nem importa; pouco faz se a IA escrever errado. Em eficiência operacional, o importante não é automatizar processos desnecessários, mas eliminá-los. No fim, parece que a IA muitas vezes só cobre o desperdício organizacional. Se essa otimização não for possível, aí talvez isso ainda seja necessário.
  • Agora parece ser o momento de entrar no “vale da desilusão”. Esse ciclo de hype é previsível. Com gente dizendo que o GPT-5 decepcionou depois de expectativas enormes, isso pode marcar o “agora acabou” do GenAI. Quando começam a perguntar sobre ROI, a realidade aparece. Os mais espertos já estão se preparando para a próxima transformação, e ainda há quem vá descer até o fundo do vale. Vai haver cada vez mais PR desesperado insistindo que "há valor real nisso".
    • Não me surpreenderia se a maioria das empresas soubesse que está desperdiçando dinheiro, mas mesmo assim investisse por causa do preço das ações.
    • O Gemini passa uma impressão bem razoável a cada atualização, mas recentemente desacelerou bastante tanto na velocidade das melhorias quanto na qualidade do que entrega. Isso parece sinal de que o muro está se aproximando. Depois de um período de estagnação, talvez venha outro salto, e LLMs parecem ter um futuro melhor do que visão computacional.
    • Sam Altman promoveu demais a capacidade do GPT-5. Do ponto de vista do usuário, não parece um grande salto em relação ao GPT-4. Mas o fato de uma arquitetura de roteador dinâmico treinável ter reduzido bastante o custo de inferência é muito significativo. É uma inovação que beneficia mais a OpenAI e a rede elétrica do que os usuários.
    • Quando a OpenAI passou do GPT-3.5-Turbo para o GPT-4, foi uma mudança revolucionária e não havia outros modelos. Mas antes mesmo do GPT-5 já surgiram vários modelos, como a série o, Llama, DeepSeek e Gemini. Daqui para frente, não deve mais haver saltos como o do GPT-3.5 para o 4. O GPT-5 unifica vários modelos em um só, mas não tem mais o título de "primeiro".
    • Ficam se perguntando se foi por isso que o time da Windsurf vendeu cedo e foi embora.
  • Perguntam quais são, de fato, os casos realistas de uso de IA que aumentam receita ou reduzem custo: 1. geração de conteúdo online (já saturada demais) 2. substituição de dev júnior (ganho limitado de produtividade) 3. substituição de atendimento ao cliente (reduz custo, mas pouco afeta receita) 4. ferramentas auxiliares (escrita, análise etc., com limitações) 5. próxima geração de interações em videogames/robôs 6. namoradas virtuais e NSFW com IA, mercado que parece lucrativo por algum tempo. Perguntam se existem outros exemplos mais realistas.
    • Estou tocando um projeto com LLM para extrair informações específicas de documentos semiestruturados e depois classificá-los/arquivá-los automaticamente. A precisão já passa de 95% e eu ainda nem fiz fine-tuning. No final ainda vai haver aprovação manual, mas isso já economiza centenas de horas por ano. IA é muito eficaz em extração de informação e classificação.
    • Na saúde, anotações clínicas, dados e interpretação de imagens se conectam diretamente à receita. Todo ano, bilhões de dólares são gastos em custos administrativos nessa parte. Se GenAI elevar bastante a qualidade e a precisão das notas, isso pode aumentar a receita de forma direta. Em seguros acontece o mesmo: há uma quantidade enorme de documentação e verificação. No fim, talvez IAs acabem trocando documentos entre si enquanto os humanos ficam sentados à beira da piscina.
    • Atendimento ao cliente com IA é uma experiência irritante do ponto de vista do usuário.
    • Pagar US$ 200 por mês por 50% de aumento de produtividade é um valor enorme. Na maioria dos países, o crescimento anual de produtividade é de 0% a 2%.
    • Gostaria de uma IA que conectasse documentos internos, wiki e base de código da empresa via RAG para facilitar onboarding e busca de informação. Em vez de substituir pessoas, seria melhor encontrar formas de tornar o trabalho mais fácil.
  • O maior erro que as pessoas cometem é não perceber que IA deve ser vista como funcionalidade, não como serviço. Ninguém pensa "quero conversar com IA hoje!". Os usuários só querem terminar o trabalho sem ficar entediados demais nem sobrecarregados. Nessa hora, o certo é a IA ajudar silenciosamente. Mas o que vendemos não é funcionalidade, é serviço (= produto), então no marketing acabam colocando IA em primeiro plano. Notion, Slack, Airtable e outros todos colocam IA na manchete, mas a essência não é a IA e sim a natureza do trabalho em que ela ajuda.
    • Eu iria além e diria que IA nem é funcionalidade, é tecnologia. O desejo não é "queria que este produto tivesse IA", e sim "queria conseguir fazer essa tarefa". Se o produto resolve meu problema, tanto faz o método. Empresas demais tentam simplesmente encaixar IA em tudo com facilidade, em vez de focar em resolver o problema que o usuário realmente quer resolver.
    • A ideia está certa, mas na prática isso acabaria com as avaliações infladas e o clima superaquecido do mercado. Quando esse momento de despertar chegar, até os poucos segmentos de software ainda "quentes" vão esfriar, e o setor vai ter de aceitar que já não é mais o mercado de 5 a 10 anos atrás.
    • Seria bom se IA fosse apresentada só como mais uma ferramenta. Bastaria um aviso único do tipo "existem esses casos de uso". Na realidade, as interfaces estão lotadas de logos de IA, autocompletar e afins, o que atrapalha a concentração. Dá a sensação de que a ferramenta virou protagonista, não apoio. Na prática, bastaria orientar o usuário para que cada um use quando precisar, mas a impressão é de que estão forçando demais. Essas empresas precisam parar um pouco e deixar a decisão para o usuário.
    • Concordo totalmente. No fim, o que importa é o valor do produto em si; o que está por baixo dele não importa.
    • Hoje em dia, quase todos os aplicativos com IA parecem "uma solução à procura de um problema".
  • O link do PDF do relatório redireciona para uma landing page e o CTA é algo como "acelere o sucesso do seu produto de IA", o que faz parecer menos um relatório objetivo e mais um conteúdo de marketing comum. Clicaram no nome do autor e não apareceu nada. Nem o site nem o autor passam confiança. O HN agora também parece Reddit: as pessoas entram pelo título, dizem se concordam ou não nos comentários, e vão embora.
  • Ficam curiosos sobre o que aconteceria se as pessoas realmente lessem o relatório https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf. Só 40% das empresas têm assinatura oficial de LLM, mas mais de 90% dos funcionários já usam ferramentas pessoais de IA no trabalho no dia a dia. Na prática, quase todos os funcionários já usam LLM de algum jeito. Os usuários de "shadow AI" usam LLM várias vezes por dia, mesmo quando os projetos oficiais da empresa continuam parados em fase piloto. É uma situação paradoxal: as iniciativas oficiais de IA da empresa fracassam, mas o uso de LLM se espalha por dentro da organização. Essa história talvez não seja uma nova bomba como o artigo sugere; pode ser quase o oposto.
  • Esse parece ser mais um caso de os EUA sempre saírem na frente em toda inovação tecnológica. Gastam muito, perdem muito, mas assumem riscos e no fim acabam abrindo uma distância difícil de alcançar. É perigoso declarar vitória cedo demais contra IA/empresas americanas.
    • Acho difícil generalizar que os EUA lideram em tudo. Em várias áreas, como finanças, ficam atrás de outros países. A China está na frente em carros elétricos, energia solar etc. Em software isso pode até ser verdade, mas o fosso defensivo americano é formado por monopólios, lock-in e regulação sob medida para os ricos.
    • Esse jeito de pensar é simplista demais e pode até distorcer a realidade.
    • Citam energia solar, veículos elétricos, drones e outros exemplos para dizer que os EUA não necessariamente estão sempre na frente.
    • Também mencionam a história do GSM para argumentar que os EUA nem sempre lideraram a inovação.
  • É interessante que a autoavaliação da própria produtividade possa diferir da realidade. Em um estudo da METR, devs sentiram que estavam 20% mais rápidos por causa da IA, mas na prática ficaram 19% mais lentos https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • Há muitas nuances que nem esse tipo de estudo consegue captar bem. O tipo de IA usada, as ferramentas, o grau de familiaridade, o processo de desenvolvimento, o tamanho do time e até o seniority e o nível de detalhismo do usuário influenciam o resultado. Hoje os investidores estão subsidiando pesadamente o preço da IA para ganhar market share, mas quando isso acabar o preço pode até cair mais. Acho que já ganho bastante com a evolução da IA, e daqui para frente o foco deve ser melhoria gradual e experiência do usuário. No momento não penso em investir em empresas de IA.
    • Às vezes a IA parece ler perfeitamente a minha mente, como um autocomplete ideal, mas em outras só atrapalha com sugestões completamente sem noção.
    • Também fica a dúvida se a IA não leva as pessoas a focarem demais em melhorias de detalhe, "in the weeds", e perderem a visão do todo. A velocidade de desenvolvimento talvez dependa mais de julgamento estratégico geral, como "devo mesmo usar essa ferramenta?" ou "essa funcionalidade é realmente necessária?".
    • A amostra é pequena, mas ainda assim é uma pesquisa bem mais significativa do que anedotas ou dados autorrelatados.