Relatório de Tendências de Mary Meeker - "AI"

xguru · 2025-06-02T11:11:02+09:00

O relatório de tendências de Mary Meeker saiu após 5 anos. Desta vez, o foco é AI. Total de 340 páginas A velocidade de uso e disseminação da AI é muito mais rápida do que a da internet, e o momento em que as máquinas ultrapassam os humanos está chegando Isso está sendo impulsionado pela infraestrutura global de internet (5,5 bilhões de usuários), por datasets digitais acumulados ao longo de mais de 30 anos e pelo surgimento de grandes modelos de linguagem (LLMs) liderados pelo ChatGPT, além de inovações em usabilidade e velocidade As novas empresas de AI estão se movendo de forma muito agressiva em inovação, investimento, lançamento de produtos e captação de capital, enquanto as big techs estabelecidas também aceleram investimentos centrados em AI e crescimento A competição em AI entre China e Estados Unidos, entre outras disputas por hegemonia tecnológica global, está se intensificando fortemente, e espera-se que este relatório contribua para a discussão sobre mudanças tecnológicas, financeiras, sociais, físicas e geopolíticas Estrutura do documento As mudanças estão acontecendo mais rápido do que no passado? → Sim, e na prática estão acelerando ainda mais Crescimento de usuários de AI + uso + despesas de capital (CapEx) = → Crescimento sem precedentes (Unprecedented) O custo de compute dos modelos de AI sobe, e o custo de inferência (Inference) cai = → Desempenho convergindo (Performance Converging), aumento do uso por desenvolvedores (Developer Usage) Crescimento de uso (Usage) + custo (Cost) + perdas (Loss) de AI = → Em nível sem precedentes (Unprecedented) A ameaça à monetização (Monetization) da AI = → Concorrência mais intensa, momentum do open source (expansão de força), ascensão da China Fusão entre o mundo físico e a AI (Ramps) = → Rápida e orientada por dados (Fast + Data-Driven) Crescimento de usuários globais de internet impulsionado por AI = → Um crescimento nunca antes experimentado A evolução (Evolution) da AI e do trabalho (Work) = → No mundo real, avançando rapidamente (Real + Rapid) Visão geral Dizer que “o mundo está mudando em uma velocidade sem precedentes” já chega a ser um eufemismo, tamanha a expansão abrupta da velocidade e do alcance das mudanças Inovação tecnológica, adoção acelerada e mudanças na liderança global formam a base (Underpinnings) de toda essa transformação Missão de fundação do Google (1998): 'organizar as informações do mundo e torná-las universalmente acessíveis e úteis' Missão de fundação do Alibaba (1999): 'facilitar fazer negócios em qualquer lugar' Missão de fundação do Facebook (2004): 'dar às pessoas o poder de compartilhar mais e tornar o mundo mais aberto e conectado' Hoje, a combinação de AI (Artificial Intelligence), poder computacional acelerado (Computing Power) e capital sem fronteiras (Borderless Capital) está impulsionando mudanças gigantescas ao melhorar drasticamente a organização, a conexão e a acessibilidade da informação Assim como os recordes de atletas no esporte são continuamente melhorados com dados/insumos/treinamento, as empresas também se tornam cada vez mais inteligentes e competitivas à medida que computadores aprendem com datasets massivos Inovações em grandes modelos (Large Models), queda no custo por token (cost-per-token), proliferação do open source (Open-Source Proliferation) e melhora no desempenho de chips (Chip Performance) elevam dramaticamente a economia, o poder e a acessibilidade da tecnologia O ChatGPT da OpenAI é o caso de “sucesso da noite para o dia (overnight success)” mais rápido da história em métricas de usuários, uso e monetização (alcançado 9 anos após a fundação) O uso de AI cresce de forma explosiva entre consumidores, desenvolvedores, empresas e governos Na revolução da Internet 1.0, a tecnologia começou nos Estados Unidos e se espalhou gradualmente, mas o ChatGPT foi adotado simultaneamente no mundo todo e cresceu rapidamente As grandes plataformas estabelecidas (incumbents) e os novos desafiantes (challengers) competem para dominar novas camadas da infraestrutura de AI, como interfaces agentic (agentic interfaces), copilots corporativos (enterprise copilots), sistemas autônomos do mundo real (real-world autonomous systems) e modelos soberanos (sovereign models) O avanço radical de AI, infraestrutura de compute e conectividade global (global connectivity) está reconfigurando de forma fundamental, em empresas e países, a maneira de trabalhar (Work), a alocação de capital (Capital Deployment) e os próprios critérios de liderança Ao mesmo tempo, mudanças na liderança global estão em curso, e as grandes potências estão ativamente contendo a competitividade e as vantagens comparativas umas das outras Países ao redor do mundo estão acelerando novamente de acordo com suas ambições econômicas, sociais e territoriais (Economic / Societal / Territorial Aspiration) Agora, duas grandes forças — tecnológica (Technological) e geopolítica (Geopolitical) — estão se entrelaçando cada vez mais profundamente O CTO da Meta Platforms, Andrew Bosworth, comentou recentemente no podcast ‘Possible’ que “agora a AI parece uma corrida espacial (Space Race), e grandes países, especialmente a China, têm capacidades muito elevadas; quase não há segredos, e todos estão avançando de forma constante” A liderança em AI (AI Leadership) pode levar diretamente à liderança geopolítica (Geopolitical Leadership) (o contrário não vale) Esse fenômeno vem acompanhado de grande incerteza (Uncertainty), mas, como disse o ex-presidente da T. Rowe Price, Brian Rogers, “estatisticamente, o mundo não acaba com tanta frequência”, então uma visão otimista é importante Do ponto de vista do investidor, sempre se assume que tudo pode dar errado, mas a expectativa sobre o que pode dar certo de verdade é a fonte da verdadeira esperança (Optimism) Ver a AI fazendo trabalho no nosso lugar lembra a magia dos primórdios do e-mail e da busca na web, e os efeitos de melhor / mais rápido / mais barato (Better / Faster / Cheaper) estão se espalhando muito mais depressa Claro, os riscos (Danger) e as incertezas também são grandes, mas existe a expectativa de que, no longo prazo, forte concorrência (Competition), inovação (Innovation), compute barato e acessível (Accessible Compute), tecnologia de AI se disseminando rapidamente e uma liderança cuidadosa e calculada (Thoughtful and Calculated Leadership) criem um equilíbrio semelhante à destruição mútua assegurada (Mutually Assured Deterrence) Para alguns, a evolução da AI pode ser uma corrida para o fundo (Race to the Bottom), mas para outros é o começo de uma corrida ao topo (Race to the Top) As forças especulativas e dinâmicas do capitalismo (Capitalism) e da destruição criativa (Creative Destruction) estão provocando uma enorme transformação tectônica Em especial, a competição feroz entre os Estados Unidos (USA), a China (China) e os líderes globais de tecnologia já está em modo 'game on' Este relatório busca mostrar de forma multidimensional as tendências deste momento dinâmico (Dynamic Time) com base em vários dados, pesquisas e benchmarks de terceiros Em última instância, o objetivo deste relatório é contribuir para essa discussão 1. As mudanças estão acontecendo mais rápido do que no passado? Technology Compounding = os números por trás do momentum "Crescimento composto da tecnologia = os números e dados por trás do momentum do crescimento explosivo" História dos ciclos de computação e a chegada da era da IA Anos 1960: mainframe (Mainframe, ~1 milhão de unidades) → minicomputador (Minicomputer, ~10 milhões de unidades) → PC (~300 milhões de unidades) → internet desktop (Desktop Internet, ~1 bilhão de usuários) → internet móvel (Mobile Internet, ~4 bilhões) → era da IA (AI Era, dezenas de bilhões) A infraestrutura de computação acumulada (CPU, GPU, nuvem/big data) se tornou a base para a disseminação da IA Na era dos dispositivos de IA, espera-se um número de dispositivos de dezenas de milhares a centenas de milhares de vezes maior do que na era dos mainframes Crescimento dos datasets de treinamento de modelos de IA (número de palavras) De 1950 a 2025, o tamanho dos datasets de treinamento (em número de palavras) dos principais modelos de IA cresceu 260% ao ano, em média Desde 2018, com o surgimento de grandes modelos como GPT-2, GPT-3 e GNMT, o volume de dados utilizados cresceu exponencialmente Modelos recentes, como o Aramco Metabrain AI, estão sendo treinados com dezenas de trilhões de palavras Crescimento do compute usado no treinamento de modelos de IA (volume de cálculo, FLOP) De 1950 a 2025, o volume de computação usado no treinamento dos principais modelos de IA cresceu 360% ao ano, em média Com o surgimento de grandes modelos como GPT-4, Grok, AlphaGo e Swift, o indicador de FLOP disparou Ganho de eficiência de compute trazido pela inovação em algoritmos De 2014 a 2023, o Effective Compute dos modelos de IA aumentou 200% ao ano, em média Otimizações algorítmicas como Chinchilla e OPT-175B contribuíram fortemente para melhorar o desempenho e reduzir o consumo de compute Crescimento de desempenho dos supercomputadores de IA De 2019 a 2025, o desempenho dos supercomputadores de IA (clusters) cresceu 150% ao ano, em média Sunway OceanLight, clusters do GPT-3/4, Frontier, El Capitan, xAI Colossus etc. Crescimento simultâneo do desempenho dos chips e do número de chips por cluster Explosão no número de modelos de IA poderosos em larga escala De 2017 a 2024, crescimento anual de 167%: disparou o número de lançamentos de grandes modelos de IA com mais de 10^23 FLOP DeepMind (AlphaGo), xAI, Anthropic, Meta, NVIDIA, Mistral e outros players passaram a surgir em sequência Crescimento de usuários, assinantes e receita do ChatGPT Entre 10/2022 e 4/2025, usuários ativos semanais (Users, MM), assinantes (Subscriber, MM) e receita (Revenue, $B) cresceram exponencialmente Mais de 800 milhões de usuários semanais, mais de 20 milhões de assinantes e receita anual se aproximando de US$ 4 bilhões Velocidade para atingir 365 bilhões de buscas anuais: ChatGPT vs Google ChatGPT: atingiu 365 bilhões de buscas anuais em 2 anos (2024) Google: levou 11 anos para chegar ao mesmo número (2009) O ChatGPT registrou uma velocidade de disseminação 5,5 vezes maior que a do Google Em 1998, quando a popularização da internet estava começando, o Google surgiu com a meta de "organizar as informações do mundo e torná-las universalmente acessíveis e úteis" Após quase 30 anos, no período de transformação mais veloz já vivido pela humanidade, hoje a maior parte das informações já está digitalizada, acessível e utilizável A mudança na forma de acessar e mover informação com base em IA está acontecendo em ritmo muito mais rápido A IA é um Compounder (algo que cresce de forma composta) sobre a infraestrutura da internet e, ao permitir que qualquer pessoa use com facilidade serviços que despertam interesse de massa, cria um fenômeno de disseminação extremamente rápida Evolução da distribuição de conhecimento (Knowledge Distribution Evolution) 1440~1992: Static + Physical Delivery Da invenção da prensa tipográfica (Printing Press) em 1440 até 1992, o conhecimento foi distribuído de forma estática (Static) e física (Physical) Ou seja, a estrutura de transmissão de conhecimento centrada em impressos, como livros, jornais e revistas, foi mantida por centenas de anos – 1993~2021: Active + Digital Delivery Após a publicação da internet (World Wide Web) em 1993, houve a transição para uma distribuição de conhecimento ativa (Active) e baseada no digital (Digital) Qualquer pessoa passou a poder criar um site e acessar/distribuir informação em tempo real A internet provocou uma transformação fundamental na “abertura e circulação do conhecimento” – 2022+: Active + Digital + Generative Delivery Com o lançamento do ChatGPT em 2022, entramos na era da distribuição de conhecimento baseada em IA generativa Generative AI: IA capaz de gerar diferentes tipos de conteúdo, como texto, imagem, áudio e código O ChatGPT bateu o recorde histórico de crescimento ao superar 1 milhão de usuários em 5 dias após o lançamento Agora, o conhecimento não é apenas armazenado e buscado: estamos na era em que a IA o gera criativamente e o entrega de imediato “Conhecimento é o acúmulo de fatos (wisdom), mas sabedoria está na sua simplificação” – Martin H. Fischer AI = Many Years Before Lift-Off A tecnologia de IA pode parecer ter crescido de forma explosiva em pouco tempo, mas houve décadas de preparação e evolução antes da popularização em larga escala Timeline de marcos da IA de 1950 a 2025 (organizada por Stanford) 10/1950: Alan Turing publica o teste de Turing (proposta do conceito de avaliação da inteligência de computadores) 6/1956: realização da Dartmouth Conference; John McCarthy cria o termo ‘Artificial Intelligence’ 1/1962: Arthur Samuel, da IBM, derrota o campeão dos EUA no jogo de damas com um programa de autoaprendizado 1/1966: Shakey, de Stanford, é implantado como o primeiro robô móvel de uso geral 1967~1996: “inverno da IA” (AI Winter) – queda no investimento/interesse sem grandes avanços 5/1997: IBM Deep Blue derrota o campeão mundial de xadrez Kasparov 9/2002: Roomba, primeiro robô aspirador produzido em massa, é lançado 10/2005: o carro autônomo Stanley, de Stanford, completa o DARPA Grand Challenge 4/2010: Apple adquire a Siri e a integra ao iPhone 4S 6/2014: o chatbot Eugene Goostman passa no teste de Turing 6/2018: OpenAI apresenta o GPT-1, o primeiro grande modelo de linguagem 6/2020: OpenAI lança o GPT-3 e a Microsoft obtém licença exclusiva 11/2022: OpenAI libera o ChatGPT ao público em geral 3/2023: OpenAI lança o GPT-4 (multimodal) / Microsoft integra o Copilot / Google lança o Bard / Anthropic lança o Claude 11/2023: 28 países, incluindo EUA, UE e China, assinam a Declaração de Segurança em IA de Bletchley 3~5/2024: Meta revela o Llama 3 (open source) / Departamento de Segurança Interna dos EUA divulga roadmap de IA / Google introduz busca baseada em IA / OpenAI lança o GPT-4o (totalmente multimodal) 7/2024: Apple anuncia o Apple Intelligence (para desenvolvedores) 9/2024: Alibaba lança 100 modelos open source Qwen 2.5 (com desempenho equivalente ao do Ocidente) 12/2024: OpenAI anuncia o o3 (modelo de melhor desempenho) 1/2025: DeepSeek revela os modelos open source de raciocínio R1 e R1-Zero / Alibaba anuncia o Qwen2.5-Max (superando GPT-4o e Claude 3.5 em desempenho de raciocínio) 2/2025: OpenAI lança o GPT-4.5 / Anthropic anuncia o Claude 3.7 Sonnet / xAI lança o Grok 3 4/2025: ChatGPT chega a 800 milhões de usuários semanais Por volta do 2º tri/25 - 10 coisas que a IA consegue fazer hoje (segundo o ChatGPT) Escrever ou editar qualquer coisa: redigir e editar instantaneamente e com fluidez e-mails, redações, contratos, poemas, código etc. Resumir e explicar materiais complexos: interpretar facilmente PDFs, documentos jurídicos, pesquisas e código, convertendo-os em inglês claro e comum Atuar como tutor em quase qualquer tema: suporte ao aprendizado passo a passo em matemática, história, idiomas, preparação para provas etc. Servir como parceiro de reflexão: apoio ao pensamento com brainstorming de ideias, depuração lógica, verificação de hipóteses etc. Automatizar tarefas repetitivas: geração de relatórios, organização de dados, resumo de slides, reescrita de textos etc. Interpretar o papel necessário: desempenhar diferentes papéis, como preparação para entrevistas, simulação de clientes e ensaio de conversas Conectar ferramentas: escrever código de integração com várias ferramentas, como API, planilhas, calendário e código web Oferecer apoio psicológico e companhia: conversar sobre o dia, reorganizar pensamentos ou simplesmente ouvir Ajudar a encontrar propósito de vida: clarificação de valores, definição de metas, elaboração de planos de ação etc. Organizar a vida: planejamento de viagens, criação de rotinas, estruturação da semana ou do fluxo de trabalho etc. Por volta de 2030? - 10 coisas que se espera que a IA possa fazer nos próximos 5 anos (segundo o ChatGPT) Gerar texto, código e lógica em nível humano: produzir resultados comparáveis aos humanos em chatbots, engenharia de software, planos de negócios, análise jurídica etc. Criar filmes e jogos completos: produção automática de conteúdo completo, incluindo roteiro, personagens, cenas, mecânicas de jogabilidade e dublagem Compreender e falar como humanos: assistentes com reconhecimento emocional, agentes de voz multilíngues em tempo real etc. Atuar como assistente pessoal avançado: planejamento de vida, recuperação de memórias, integração de agenda e informações entre todos os apps e dispositivos etc. Operar robôs humanoides: ajuda doméstica, cuidado de idosos, automação de varejo e hospitalidade etc. Operar atendimento ao cliente e vendas de forma autônoma: resolução de problemas end-to-end, upselling, integração com CRM, suporte 24/7 etc. Personalizar toda a vida digital do indivíduo: aprendizado adaptativo, recomendação dinâmica de conteúdo, gestão de saúde personalizada etc. Construir e operar negócios autonomamente: startups baseadas em IA, otimização de estoque e preços, operação digital integral etc. Automatizar descobertas científicas: design de fármacos, síntese de novos materiais, modelagem climática, teste de novas hipóteses etc. Colaborar criativamente como parceiro: coautoria de romances, produção musical, design de moda, arquitetura e outras colaborações criativas Por volta de 2035? - 10 coisas que se espera que a IA possa fazer nos próximos 10 anos (segundo o ChatGPT) Realizar pesquisa científica: geração de hipóteses, execução de simulações, desenho e análise de experimentos etc. Projetar tecnologias avançadas: descoberta de novos materiais, design em biotecnologia, criação de protótipos de sistemas de energia etc. Simular mentes semelhantes às humanas: criação de personas digitais com memória, emoções e comportamento adaptativo Operar empresas de forma autônoma: gerenciar P&D, finanças e logística com intervenção humana mínima Executar tarefas físicas complexas: manipulação de ferramentas, montagem de peças, adaptação em ambientes reais etc. Orquestrar sistemas globais: otimizar logística, uso de energia e resposta a crises em larga escala Modelar sistemas biológicos: simulação de células, genes e organismos e aplicação em tratamento/pesquisa Fornecer tomada de decisão em nível especialista: oferecer aconselhamento jurídico, médico e empresarial em tempo real Participar de debate público e formulação de políticas: mediação de fóruns, proposta de projetos de lei, coordenação de interesses etc. Construir mundos virtuais imersivos: gerar ambientes 3D interativos apenas com prompts de texto A velocidade do desenvolvimento de IA está em um nível que ninguém previa Mudança dos protagonistas do desenvolvimento de modelos de machine learning (2003~2024) De 2003 a 2014, a academia (academia) liderou o desenvolvimento de modelos de machine learning (Era da Academia) Desde 2015, a indústria (industry) superou amplamente a academia em dados, capacidade computacional e capital investido, liderando a inovação (Era da Indústria) Em 2024, cerca de 60 modelos de ML dignos de destaque são desenvolvidos por ano na indústria Crescimento explosivo do número de desenvolvedores de IA (com base no ecossistema NVIDIA, 2005~2025) No ecossistema NVIDIA, o número global de desenvolvedores aumentou 6 vezes em 7 anos (com projeção de alcançar 6 milhões em 2025) O maior crescimento ocorreu entre 2018 e 2025 Número de desenvolvedores no ecossistema de IA do Google (2024~2025) Maio de 2024: 1,4 milhão → maio de 2025: 7 milhões Crescimento de 5 vezes em apenas 1 ano, com expansão explosiva da comunidade de desenvolvedores de IA centrada na plataforma Gemini Aumento explosivo das patentes americanas relacionadas à computação (1960~2024) Nos 8 anos após o IPO da Netscape em 2003: +6.300 casos; nos 18 anos de 2004 a 2022: aumento de +1.000 casos Após o lançamento do ChatGPT (2022), houve um salto de +6.000 em apenas 1 ano Patentes de inovação relacionadas a computação/IA estão sendo despejadas em larga escala Desempenho da IA supera o nível humano em 2024 No benchmark MMLU (conhecimento geral + raciocínio), em 2024 os sistemas de IA alcançaram 92,3% de precisão, superando os humanos (89,8%) Capacidade da IA de se passar por humana (1º tri de 2025) GPT-4o (sem persona): 73% das respostas foram confundidas com respostas humanas GPT-4.5 (com persona): falha em identificar que era IA em mais de 90% dos casos A semelhança e o realismo das respostas de IA melhoraram drasticamente Realismo das conversas com IA (caso do teste de Turing) Exemplo real de conversa em teste de Turing usando GPT-4.5 87% dos participantes do experimento confundiram com humano o lado (A), que na verdade era uma IA, enquanto o humano (B) foi julgado como tendo uma “atmosfera de IA” A capacidade de conversa natural da IA moderna superou a dos humanos Evolução do desempenho de geração de imagens por IA Comparação entre Midjourney v1 (2022) e v7 (2025): em 3 anos, o resultado da geração de joias (colar de girassol) evoluiu para um realismo esmagador Imagens geradas por IA vs imagens reais (2024) Em 2024, fotos de pessoas geradas por IA (StyleGAN2) tornaram-se tão sofisticadas que quase não se distinguem de fotos reais O realismo das imagens geradas aumentou drasticamente Realismo da geração/tradução de voz por IA (caso ElevenLabs) A ferramenta de geração de voz por IA da ElevenLabs avançou em dublagem automática, tradução multilíngue em tempo real, preservação da voz original etc. o tráfego global do site ultrapassou 20 milhões de visitas mensais em 2 anos, e 60% das empresas da Fortune 500 adotaram a solução A geração e tradução de áudio por IA também estão avançando de forma explosiva Popularização da tradução de áudio com IA (Spotify, maio de 2025) O Spotify começou a aceitar traduções por IA de audiolivros em 29 idiomas em parceria com a ElevenLabs Apresentou como visão “uma era em que qualquer pessoa cria conteúdo em seu idioma nativo, e a IA o traduz em tempo real e o entrega ao mundo todo” (CEO Daniel Ek) No 1º trimestre de 2025, 678 milhões de usuários ativos mensais, 268 milhões de assinantes e receita anual de 16,8 bilhões de euros Aceleração do desempenho da IA: novos casos de uso (novembro de 2024, Morgan Stanley) Dobramento de proteínas (Protein Folding): DeepMind AlphaFold, previsão de quase todas as estruturas de proteínas Detecção de câncer (Cancer Detection): Microsoft & Paige, construção do maior modelo de detecção de câncer baseado em imagens do mundo Robótica (Robotics): Google, demonstração de robô que entende e executa instruções humanas usando LLM IA agêntica (Agentic AI): Amazon, divulgação de ferramenta que executa tarefas conforme instruções do usuário Tradução universal (Universal Translation): Meta, lançamento de modelo multimodal de interpretação e tradução multilíngue Criação de vídeo digital (Digital Video Creation): Channel 1 AI, demonstração de produção de vídeo de notícias personalizado com base em GenAI Benefícios e riscos da IA (Benefits & Risks) Benefícios do desenvolvimento de IA Todas as conquistas da civilização humana são fruto da inteligência humana, e quanto maior o nível de inteligência de máquina (machine intelligence), mais as ambições da humanidade também se expandem IA e robôs podem libertar a humanidade do trabalho repetitivo e, com o aumento da produtividade, abrir uma era de paz e prosperidade A aceleração da pesquisa científica pode antecipar a solução de doenças, mudanças climáticas e problemas de recursos Riscos do desenvolvimento de IA Demis Hassabis (Google DeepMind): "Se resolvermos a IA primeiro, poderemos resolver todo o resto. Mas, antes de termos essa oportunidade, podem surgir uso indevido, abuso e riscos não intencionais da IA" Riscos já evidentes e que tendem a crescer ainda mais: armas autônomas letais (lethal autonomous weapons), vigilância (surveillance), tomada de decisão enviesada (biased decision making), impacto no emprego (employment impact), segurança e proteção (safety-critical applications, cybersecurity) etc. "O sucesso no desenvolvimento da IA pode ser o maior acontecimento da história da civilização humana, mas também pode ser o último, se não aprendermos a evitar seus riscos" - Stephen Hawking Crescimento de Usuários + Uso + CapEx de IA = Sem Precedentes Tomando o ChatGPT como referência, em apenas 17 meses ele ultrapassou 800 milhões de usuários ativos semanais (+8x) A velocidade da adoção global de IA (Global Adoption), em comparação com os primeiros anos da internet, também mostra uma expansão sem precedentes (atingiu 90% de usuários fora da América do Norte em 3 anos; a internet levou 23 anos) Até alcançar 100 milhões de usuários, o ChatGPT levou 0,2 ano (cerca de 2 meses), um crescimento muito mais rápido que grandes serviços de internet como TikTok, Instagram e YouTube Até alcançar 1 milhão de usuários (clientes): Ford Model T, 2.500 dias; iPhone, 74 dias; ChatGPT, 5 dias — com custo de acesso de US$ 0, no auge da acessibilidade Nos EUA, estima-se que a IA levará 3 anos para chegar a 50% dos lares, contra internet móvel (6 anos), desktop (12 anos), PC (20 anos) e Revolução Industrial (42 anos), ou seja, metade do tempo A velocidade de adoção e difusão da IA é mais rápida do que a de qualquer tecnologia na história, e seu alcance e escala de impacto também superam as expectativas Adoção de IA por empresas de tecnologia é prioridade máxima Big techs e grandes empresas de tecnologia estão concentrando esforços em IA como tema central de gestão NVIDIA, Google, Microsoft, Meta, Amazon, Baidu, IBM, C3.ai etc. Entre 2020 e 2024, a frequência de menções a IA em transcrições de resultados disparou, marcando o início de uma competição centrada em IA Amazon (CEO Andy Jassy) "A IA generativa vai revolucionar praticamente todas as experiências dos clientes" Adoção e ganho de eficiência com IA em todas as áreas, como programação, busca, compras, finanças, saúde, robótica e biotecnologia Google (CEO Sundar Pichai) "A IA é o meio mais importante para avançar nossa missão de organizar a informação e torná-la universalmente acessível" "A oportunidade da IA está em outra dimensão em relação a tudo o que vimos até agora" Duolingo (CEO Luis von Ahn) "A IA generativa contribui para geração de dados, novos recursos e eficiência em toda a empresa" Até o currículo de xadrez foi prototipado inteiramente com IA xAI (CEO Elon Musk) "No Grok AI, a busca pela verdade (truth-seeking) é a essência e algo indispensável para a segurança da IA" "Precisamos criar uma IA o mais orientada à verdade possível" Roblox (CEO David Baszucki) "A IA é uma ferramenta de aceleração que maximiza a capacidade individual; no futuro, todos terão sua própria IA" NVIDIA (CEO Jensen Huang) "Dentro de 10 anos, a IA será a infraestrutura de todas as indústrias, todos os países e todas as empresas" "Um datacenter de IA é, em essência, uma 'AI factory', que produz um valor enorme" Líderes globais de tecnologia estão apostando tudo na adoção de IA e na expansão de infraestrutura, enfatizando em uníssono que a IA é o núcleo da competitividade futura de empresas e sociedades A adoção de IA por empresas tradicionais também sobe rapidamente na lista de prioridades Forte alta no interesse por IA entre empresas do S&P 500 No 4º trimestre de 2024, 50% das empresas do S&P 500 mencionaram 'IA' em apresentações de resultados (forte aumento em relação a 2015) Em todo o ambiente corporativo, a IA emergiu como agenda estratégica central Para grandes empresas globais, o objetivo da adoção de IA é 'crescimento de receita' Nos próximos 2 anos, a maioria dos objetivos de investimento em IA generativa (GenAI) estará focada em 'crescimento e rentabilidade', como produtividade, atendimento ao cliente, receita e eficácia de marketing Redução de custos (cost reduction) é prioridade relativamente menor 75% dos CMOs globais (diretores de marketing) estão testando/adotando ferramentas de IA A maior parte das organizações de marketing está conduzindo testes iniciais ou pilotos, e uma parcela significativa já adotou IA plenamente Casos reais de adoção Bank of America: Erica Virtual Assistant 40 milhões de clientes, 2,5 bilhões de interações acumuladas, mais de 50.000 atualizações de desempenho Consolidou-se como assistente financeiro digital 24/7 JP Morgan: modernização de IA de ponta a ponta Com a adoção de IA/ML, espera-se entre 2023 e 2025 um ganho de +35~65% tanto em receita quanto em eficiência Kaiser Permanente: prontuário médico com IA (AI Scribe) Adotado por milhares de profissionais de saúde, reduz a carga de documentação e melhora a experiência do paciente e a qualidade do atendimento Yum! Brands: Byte by Yum! Em 2025, sistemas de pedidos e operação com IA foram adotados em 25.000 restaurantes Mesmo grandes empresas tradicionais estão tratando a adoção de IA não como 'redução de custos', mas como prioridade estratégica centrada em crescimento e inovação Em cada setor, casos concretos de sucesso no uso de IA estão se acumulando rapidamente A adoção de IA em educação, governo e pesquisa também sobe rapidamente na lista de prioridades Casos de integração de IA no setor de educação (instituições educacionais) Arizona State University: criação de uma organização dedicada ao desenvolvimento de ferramentas de IA ('AI Acceleration') Parceria Oxford-OpenAI: cooperação de 5 anos para fortalecer pesquisa e alfabetização em IA NextGenAI: lançamento de um consórcio de US$ 50 milhões com participação de 15 universidades de pesquisa, incluindo MIT, Harvard e Caltech ChatGPT Gov: lançamento do ChatGPT para uso exclusivo de órgãos do governo federal dos EUA (janeiro de 2025) Laboratórios nacionais dos EUA: cooperação em infraestrutura de IA para energia nuclear, cibersegurança e ciência avançada Expansão das políticas de adoção governamental (Sovereign AI) NVIDIA Sovereign AI Partners: aceleração da construção de infraestrutura nacional de IA em países como França, Suíça, Espanha, Equador, Japão, Vietnã e Singapura "Ver países investindo em infraestrutura de IA é semelhante ao que aconteceu no passado com eletricidade e infraestrutura de internet" (CEO da NVIDIA, Jensen Huang) Ampliação da aplicação de IA em pesquisa (R&D) e saúde Dispositivos médicos com IA aprovados pela FDA: 223 aprovações anuais em 2023, crescimento explosivo em relação a 2015 (orçamento de IA do governo federal dos EUA no FY21~FY25: US$ 14,7 bilhões) Descoberta de fármacos com IA: tempo para chegar à fase pré-clínica (Pre-Clinical) reduzido em 30~80% em relação aos métodos tradicionais (aceleração de 1,5~12x) Mesmo em setores sem fins lucrativos/públicos, como educação, governo, pesquisa e saúde, a adoção e integração de IA estão se expandindo rapidamente Com investimento em infraestrutura, flexibilização regulatória e pesquisa conjunta, a velocidade da inovação em IA fora da indústria também está acelerando Usuários de IA + Uso + Crescimento de CapEx = Sem Precedentes Situação do uso do ChatGPT entre adultos nos EUA A proporção de adultos americanos que já usaram o ChatGPT disparou de 18% em julho de 2023 para 37% em janeiro de 2025 Entre 18 e 29 anos, o índice é de 55%, e entre 30 e 49 anos, de 44%, mostrando maior uso entre os mais jovens O CEO da OpenAI, Sam Altman, avaliou que “os mais jovens usam como orientador de vida, enquanto os mais velhos usam como substituto da busca” Aumento do tempo médio diário de uso do app do ChatGPT De julho de 2023 a abril de 2025, entre usuários do app do ChatGPT nos EUA, o tempo médio diário de uso aumentou 202% Passou de cerca de 7 minutos por dia para quase 20 minutos, indicando um salto no engajamento dos usuários com apps de IA Aumento das sessões e do tempo por sessão no app do ChatGPT De julho de 2023 a abril de 2025, o número médio de sessões cresceu 106%, e o tempo por sessão aumentou 47% Os usuários passaram a usar o app com mais frequência e por mais tempo, consolidando as ferramentas de IA no cotidiano Comparação da retenção semanal de usuários entre ChatGPT e Google Search De janeiro de 2023 a abril de 2025, a retenção semanal do ChatGPT foi de 80%, superando com folga os 58% do Google Search A fidelidade dos usuários a serviços de IA aparece mais alta do que na busca tradicional Efeitos do uso de chatbots de IA no trabalho nos EUA Mais de 72% dos trabalhadores americanos que usam chatbots de IA relataram desempenho “mais rápido e melhor” no trabalho Foram relatadas mudanças positivas tanto em eficiência quanto na qualidade do trabalho Casos de uso do ChatGPT entre universitários nos EUA Entre universitários americanos (18 a 24 anos), os usos do ChatGPT se concentram em iniciar trabalhos/projetos, resumir textos, brainstorming de ideias, resolução de problemas, preparação para provas, pesquisa e tutoria, com foco em estudo, pesquisa e orientação de carreira A IA vem sendo usada ativamente para resolver tarefas práticas, trabalhos criativos e até planejamento de carreira Serviços de automação de pesquisa profunda baseados em IA Expansão dos recursos de deep research de grandes empresas como Google Gemini, OpenAI ChatGPT e xAI Grok A automação de tarefas avançadas de trabalho intelectual está se acelerando, com pesquisa automatizada na web, geração de insights, criação automática de relatórios de dezenas de páginas e apuração de fatos Evolução dos agentes de IA = das respostas em chat para a automação real do trabalho Enquanto os chatbots tradicionais ficavam limitados a conversas restritas e respostas simples, os agentes de IA estão evoluindo para prestadores de serviço capazes de processar por conta própria raciocínio, execução e tarefas em múltiplas etapas Exemplos: agendamento de reuniões, envio de relatórios, login em ferramentas e automação de fluxos de trabalho entre várias plataformas Comandos em linguagem natural já bastam para executar diretamente tarefas complexas Essa mudança é semelhante à transição, no início dos anos 2000, de sites estáticos para web apps dinâmicos como Gmail e Google Maps A evolução vai de uma interface simples de mensagens para uma infraestrutura que executa trabalho real Diferentemente dos assistentes iniciais, que forneciam apenas entradas claras ou resultados limitados, os agentes de IA agora contam com foco em objetivos, autonomia e salvaguardas, tornando possível executar processos complexos como interpretação de intenção, gerenciamento de memória e colaboração entre apps As empresas lideram a adoção em ritmo mais rápido e já avançam além da simples experimentação, intensificando investimentos em frameworks e na construção de ecossistemas de agentes Crescimento explosivo do interesse global por AI Agent (tendências de busca no Google, 2024~2025) O volume de buscas no Google pela palavra-chave “AI Agent” disparou 1.088% em 16 meses Em março de 2025, após a OpenAI lançar ferramentas de desenvolvimento para AI Agent, o volume de buscas acelerou ainda mais, sugerindo um ponto de virada técnico para o setor Aceleração dos lançamentos de produtos de AI Agent por incumbentes de IA (2024~2025) Grandes empresas de tecnologia como Salesforce, Anthropic, OpenAI e Amazon vêm lançando em sequência novos produtos baseados em agentes de IA Salesforce Agentforce: automação de atendimento ao cliente, prospecção de leads, rastreamento de pedidos etc. Anthropic Claude 3.5 Computer Use: controle direto da tela do computador, extração de dados da web, compras online etc. OpenAI Operator: automação de tarefas online complexas Amazon Nova Act: automação residencial, coleta de informações, compras, gestão de agenda etc. Os produtos de AI Agent estão indo além dos chatbots tradicionais e se expandindo como ferramentas práticas de automação que de fato substituem trabalho Próxima fronteira da IA = Artificial General Intelligence O que é Artificial General Intelligence (AGI)? AGI se refere a um sistema capaz de executar todo o conjunto de tarefas intelectuais humanas, incluindo raciocínio, planejamento, aprendizado com pequenos volumes de dados e generalização de conhecimento entre diferentes áreas Diferentemente dos modelos atuais de IA, que mostram desempenho excelente em domínios específicos, a AGI poderá resolver com flexibilidade novos problemas em qualquer área, sem necessidade de reentreinamento O recente crescimento exponencial em escala de modelos, dados de treinamento e eficiência computacional está acelerando o desenvolvimento da AGI Prazo para alcançar a AGI e expectativas O momento em que a AGI será alcançada ainda é incerto, mas as expectativas dos especialistas avançaram significativamente nos últimos anos Em janeiro de 2025, o CEO da OpenAI, Sam Altman, afirmou: “agora estamos confiantes de que sabemos como construir a AGI no sentido em que a entendíamos tradicionalmente” Isso sugere que os avanços em arquitetura de modelos, eficiência de inferência e ambientes de treinamento em larga escala estão reduzindo a distância entre pesquisa e aplicação prática Inferência é o processo pelo qual um modelo já treinado gera previsões, respostas ou conteúdo a partir da entrada do usuário. Essa etapa é muito mais rápida e eficiente do que o treinamento A AGI começa a ser vista não mais como um ponto final hipotético, mas como um limiar alcançável O significado de alcançar a AGI Com a realização da AGI, os papéis fundamentais de software e hardware serão redefinidos Em vez de repetir tarefas pré-programadas, os sistemas passarão a entender objetivos, formular planos e se autocorrigir em tempo real Fluxos de trabalho em pesquisa, engenharia, educação e logística poderão operar sem supervisão humana Mesmo diante de novos problemas, os sistemas serão capazes de se adaptar ao contexto sem reentreinamento, operando como especialistas humanos Robôs humanoides baseados em AGI podem transformar de forma radical o ambiente físico e a maneira como trabalhamos Impacto social que a AGI pode trazer A AGI não é o ponto final, mas uma transição gradual de capacidades Instituições, trabalho e estruturas de decisão serão reorganizados conforme a forma de adoção da AGI e os mecanismos de controle implementados O efeito sobre a produtividade pode ser enorme, mas os benefícios também podem ser distribuídos de forma desigual As mudanças geopolíticas, éticas e econômicas tendem a ocorrer gradualmente Assim como na Revolução Industrial, na transformação digital e na revolução algorítmica, os resultados dependerão não apenas do que a tecnologia pode fazer, mas de como a sociedade a aceita e a regula AI User + Usage + CapEx Growth = sem precedentes Nos últimos 20 anos, o CapEx no setor de tecnologia cresceu rapidamente seguindo um arco centrado em dados No início, os investimentos se concentraram em armazenamento e acesso; depois em distribuição e escalabilidade; e agora o foco está em computação e inteligência Na primeira onda, os recursos foram direcionados para grandes fazendas de servidores, cabos submarinos e data centers iniciais, estabelecendo a base da computação em nuvem para empresas como Amazon, Microsoft e Google Nessa etapa, o objetivo central era “armazenar, organizar e fornecer como serviço” A segunda onda, ainda em curso, está centrada no fortalecimento da infraestrutura computacional para cargas de trabalho de IA O CapEx dos hyperscalers está migrando para infraestrutura especializada como GPUs, TPUs, aceleradores de IA, resfriamento líquido e projetos avançados de data centers Em 2019, a IA era uma função de pesquisa, mas em 2023 passou a integrar os itens centrais de CapEx (despesa de capital) Brad Smith, presidente da Microsoft (blog de 25/4): “Assim como a eletricidade foi uma tecnologia de propósito geral, a IA e os data centers em nuvem representam a próxima fase da industrialização” As big techs globais estão realizando investimentos anuais na casa de dezenas de trilhões de won Mais do que simplesmente coletar dados, a capacidade de aprender rapidamente, personalizar profundamente e distribuir em larga escala está se tornando o núcleo da competitividade Os gastos de CapEx (investimento em infraestrutura) de grandes empresas de tecnologia como AWS, NVIDIA, MSFT, Google, Apple e Meta vêm subindo de forma consistente há anos Data Centers = principais beneficiários do gasto de CapEx em IA Para entender a viabilidade econômica da infraestrutura de IA, é necessário observar a velocidade e a escala de construção de data centers Com a explosão da demanda centrada em IA, o CapEx (despesas de capital) de data centers das empresas globais de TI atingiu um recorde histórico e continua acelerando, chegando a US$ 455 bilhões em 2024 Tanto hyperscalers quanto empresas AI-first estão investindo bilhões de dólares na construção de infraestrutura de hardware de alto desempenho e alto consumo de energia, não apenas para armazenamento, mas também para inferência em tempo real e treinamento de modelos em larga escala À medida que a IA deixa de ser uma tecnologia experimental e passa a ser infraestrutura essencial, os data centers também passam a ocupar uma posição central nesse processo O CEO da NVIDIA, Jensen Huang, enfatizou que “agora os data centers de IA são fábricas de IA” O data center xAI Colossus, em Memphis, Tennessee, nos EUA, concluiu um complexo equivalente a 418 casas em apenas 122 dias, alcançando velocidade e eficiência sem precedentes (menos da metade do tempo médio de construção de uma casa nos EUA) Com módulos pré-fabricados, licenciamento acelerado e integração vertical de eletricidade/mecânica/software, chega a era em que data centers são construídos na velocidade do desenvolvimento de produtos de TI O CapEx de data centers é determinado por terreno, energia, chips e sistemas de refrigeração, e as cargas de trabalho de IA geram demandas de calor e energia muito maiores do que a computação corporativa tradicional O OpEx (despesas operacionais) se concentra em custos de energia e manutenção dos sistemas, especialmente porque clusters densos de treinamento de IA operam sob carga máxima de forma contínua A receita vem da venda de compute (APIs de IA, cobrança de plataformas corporativas, ganhos internos de produtividade etc.), mas as empresas que constroem infraestrutura de forma antecipada podem enfrentar prazos mais longos para recuperar o investimento Startups podem levar de alguns trimestres a vários anos entre a construção da infraestrutura e a monetização Do ponto de vista da cadeia de suprimentos, a garantia de infraestrutura elétrica (transformadores, subestações, turbinas, GPUs, cabos etc.) está surgindo como um novo gargalo Os data centers não são apenas ativos físicos, mas atuam como hubs estratégicos de infraestrutura para imobiliário, energia, logística, compute e monetização de software As empresas que resolverem corretamente esse quebra-cabeça complexo vão definir a geografia futura da economia da IA Data Centers = devoradores de eletricidade A tensão entre IA e infraestrutura energética está se intensificando gradualmente Com o avanço da IA, data centers especializados em IA estão registrando consumo de eletricidade comparável ao da indústria pesada tradicional O principal motivo para a explosão da demanda elétrica é a enorme capacidade computacional necessária para treinar e operar modelos de IA Em 2024, os data centers responderam por cerca de 1,5% do consumo global de eletricidade Desde 2017, o consumo global de eletricidade dos data centers cresceu em média 12% ao ano Isso equivale a mais de quatro vezes a velocidade de crescimento do consumo total de eletricidade Na participação por país no consumo de eletricidade, os EUA lideram com 45%, seguidos por China (25%) e Europa (15%) Quase metade da capacidade de data centers dos EUA está concentrada em cinco grandes clusters regionais Mercados emergentes e países em desenvolvimento (excluindo a China) respondem por 50% dos usuários de internet, mas têm menos de 10% da capacidade de data centers Com a disseminação da IA, a rede elétrica (grid) e a infraestrutura de fornecimento estão emergindo como gargalos para o desempenho da IA Já não são mais os dados ou os algoritmos, mas sim o fornecimento de energia que está se tornando a principal restrição ao crescimento da IA Ao mesmo tempo, a IA está acelerando a eficiência operacional e a inovação dentro do setor de energia A otimização baseada em IA já está sendo aplicada de forma efetiva em toda a cadeia de suprimentos de energia, incluindo geração, minerais, transmissão e consumo Mas, enquanto a demanda de IA e os custos de energia continuarem subindo, os data centers acabarão atendendo apenas clientes com capacidade de pagar essa conta Altos custos de compute para modelos de IA / em alta + custos de inferência por token em queda = convergência de desempenho + aumento no uso por desenvolvedores O treinamento de grandes modelos de linguagem (LLMs) é uma das tarefas mais intensivas em custo da história da humanidade, e, à medida que o número de parâmetros e a complexidade dos algoritmos aumentam para melhorar o desempenho, os custos de treinamento disparam para bilhões de dólares Quanto mais se intensifica a corrida para construir os melhores modelos de uso geral, mais difícil fica diferenciar a qualidade dos resultados e sustentar a rentabilidade, gerando um fenômeno de “convergência” Em contrapartida, os custos de inferência estão caindo rapidamente Por exemplo, a GPU NVIDIA Blackwell de 2024 consome 105 mil vezes menos energia por token do que a Kepler de 2014 Graças à inovação em hardware e à melhoria da eficiência algorítmica dos modelos, o custo de inferência por token está caindo rapidamente A queda no custo de inferência intensifica a concorrência entre fornecedores de LLMs A disputa não é apenas por precisão, mas também por latência, disponibilidade e preço por token Os custos em dólar já caíram para alguns centavos e logo devem ficar abaixo de 1 centavo Do ponto de vista dos usuários (desenvolvedores), isso torna possível o acesso a IA poderosa a baixo custo O desenvolvimento de novos serviços e produtos está se acelerando, e o número real de usuários e casos de uso também cresce rapidamente Para os fornecedores de modelos, surgem novos desafios: queda de rentabilidade e mudança no modelo de negócios Com treinamento caro e oferta barata, estão sendo buscadas novas estratégias, como integração vertical/horizontal e mercados de LLMs especializados Os LLMs de uso geral começam a assumir um caráter de guerra de desgaste sem rentabilidade Com o surgimento de modelos menores e customizados, ganha força a experimentação de estruturas de receita diferenciadas em relação aos grandes modelos tradicionais Custos de inferência por token em queda A redução dos custos de inferência de IA repete um padrão clássico da evolução da computação Como disse o CTO da Microsoft Nathan Myhrvold em 1997, “software é como gás: ocupa todo o recipiente disponível”; da mesma forma, a demanda por IA está crescendo até usar toda a infraestrutura disponível Quanto melhor o desempenho dos modelos, mais o uso (queries, tokens, número de modelos) explode, e o escopo e a frequência de uso da inteligência artificial também se expandem rapidamente A velocidade de avanço da infraestrutura também está em nível recorde Em 2024, a GPU NVIDIA Blackwell melhorou a eficiência energética na geração de tokens em 105 mil vezes em relação à Kepler de 2014 Isso significa que não se trata apenas de redução de custo, mas do resultado de inovações em arquitetura de hardware e materiais A melhora na eficiência do hardware é um fator central para compensar a carga elétrica da crescente demanda por IA e internet Mas, até agora, essas melhorias por si só ainda não conseguiram impedir completamente o aumento da demanda total de eletricidade Esse fenômeno é semelhante ao Paradoxo de Jevons, de 1865 Quanto maior a eficiência no uso de recursos, maior pode ser o consumo total, e esse paradoxo também se repete na IA Em consequência, a antiga fórmula da tecnologia — queda de custo, melhora de desempenho e aumento de uso — também está se repetindo na IA O avanço da infraestrutura volta a estimular o aumento do uso de IA, gerando novas preocupações com infraestrutura elétrica e produção de energia Desempenho convergindo Rápida convergência entre os modelos de IA no topo do ranking de desempenho Segundo os dados do LMSYS Chatbot Arena da Stanford HAI (2024~2025), as pontuações de avaliação de chatbot de três modelos — Google, OpenAI e DeepSeek — ficaram em 1.385, 1.366 e 1.362, restando apenas uma diferença mínima de cerca de 1% a 2% Ao longo de um ano, a diferença de pontuação entre os modelos líderes foi diminuindo cada vez mais, deixando clara a tendência de que a competição por desempenho está se nivelando na prática Está cada vez mais difícil diferenciar a qualidade entre os mais recentes grandes modelos de linguagem (LLMs) Do ponto de vista do usuário, forma-se um cenário em que “qualquer modelo parece quase igual” Os fornecedores de modelos provavelmente vão migrar para uma competição baseada em fatores não ligados ao desempenho, como custo, estabilidade do serviço e recursos especializados Uso por desenvolvedores em alta A explosão da atividade de desenvolvedores de AI decorre da queda drástica nos custos de inferência e da maior acessibilidade a modelos capazes Entre 2022 e 2024, o custo por token para executar modelos de linguagem caiu cerca de 99,7% Isso foi impulsionado por avanços expressivos em hardware e eficiência algorítmica Uma tecnologia que antes só era acessível a grandes empresas agora pode ser usada com facilidade também por desenvolvedores individuais, criadores independentes de apps, pesquisadores e pequenos negócios O colapso dos custos tornou a experimentação barata e acelerou iteração e productização Qualquer pessoa com uma ideia agora consegue desenvolver serviços de AI com facilidade À medida que o desempenho dos modelos converge rapidamente, a fórmula de escolha de modelo está mudando A diferença entre os grandes modelos de ponta e alternativas menores e mais eficientes está diminuindo Em várias tarefas reais, como resumo, classificação, extração e roteamento, quase não há diferença de desempenho na prática Agora, desenvolvedores podem obter resultados parecidos por meio de modelos mais baratos ou de execução local/APIs de baixo custo, em vez de modelos premium caros O efeito é maximizado especialmente quando há fine-tuning com dados específicos da tarefa Essa mudança enfraquece a alavanca de preços do "establishment" dos modelos e promove a democratização do desenvolvimento de AI Em vez de depender de um único provedor (vendor), passa a ser possível combinar e distribuir o uso entre modelos de diferentes ecossistemas OpenAI ChatGPT, Meta Llama, Mistral Mixtral, Anthropic Claude, Google Gemini, Microsoft Phi etc. Entre modelos com pontos fortes distintos, torna-se possível escolher o modelo ideal de acordo com necessidades técnicas e financeiras Saída do lock-in de plataforma (dependência), com transição para uma era de escolha e distribuição liderada por desenvolvedores Um flywheel de crescimento de infraestrutura impulsionado por desenvolvedores está se formando À medida que mais desenvolvedores criam apps AI-native, cresce rapidamente o ecossistema de ferramentas/wrappers/bibliotecas/frameworks Frameworks de frontend, pipelines de embedding, roteadores de modelo, vector DBs, camadas de serving etc. Cada onda de atividade dos desenvolvedores reduz a barreira de entrada da onda seguinte O tempo entre ideia e protótipo, e entre protótipo e produto, está diminuindo Não só os custos, mas também a complexidade, estão caindo rapidamente Mais do que uma mudança de plataforma, está se abrindo uma era de explosão criativa Historicamente, o padrão se repete: plataformas com muitos desenvolvedores (e uso/adoção contínuos) acabam vencendo Como visto no discurso “Developers! Developers! Developers!” de Steve Ballmer, da Microsoft, os desenvolvedores são importantes A plataforma que conquistar a adoção dos desenvolvedores e sustentar escala e melhoria contínuas acabará dominando o mercado The AI Developer Next Door Forte alta na adoção de ferramentas de desenvolvimento com AI (2023~2024, Stack Overflow) Em 2024, em comparação com 2023, a proporção de desenvolvedores que usam ferramentas de AI aumentou bastante Entre desenvolvedores profissionais, subiu de 44% para 63%; entre pessoas aprendendo a programar, de 55% para 65% Explosão de repositórios open source de desenvolvedores de AI (GitHub, 2022.11~2024.3) O número de repositórios de desenvolvedores de AI no GitHub aumentou cerca de 175% em 16 meses Após o surgimento de modelos/ferramentas importantes como ChatGPT e Stable Diffusion, o ecossistema de desenvolvimento cresceu de forma explosiva Expansão do ecossistema de desenvolvedores de AI (segundo o Google, uso mensal de tokens) De 10 trilhões de tokens em maio de 2024 para 480 trilhões em maio de 2025, um aumento de 50 vezes em apenas um ano O uso por desenvolvedores se ampliou fortemente por meio do Google Gemini, AI API etc. Crescimento do ecossistema Microsoft Azure AI Foundry (uso trimestral de tokens) De 20 trilhões no 1º trimestre de 2024 para 100 trilhões de tokens no 1º trimestre de 2025, crescimento de 5 vezes Mais de 70 mil empresas e desenvolvedores já utilizam a plataforma Diversificação dos casos de uso por desenvolvedores de AI (2024, segundo a IBM) Geração de código, detecção/correção de bugs, automação de testes, gestão de projetos/workflows, documentação, refatoração/otimização, reforço de segurança, CI/CD, design de UX, arquitetura de sistemas etc.: o uso de AI está acelerando em uma ampla gama de áreas AI Usage + Cost + Loss Growth = Unprecedented O crescimento da AI, seus custos e o tamanho das perdas estão aumentando em um nível sem precedentes Sinais de alerta como “desta vez é diferente”, “dá para acertar a rentabilidade com economia de escala” e “vamos monetizar os usuários depois” costumavam levar ao fracasso, mas no caso dos investimentos das big techs também houve casos reais de sucesso A disputa atual em AI envolve simultaneamente capital em escala sem precedentes e grandes empresas guiadas por fundadores A competição entre potências globais como Estados Unidos e China acelera a inovação em AI Em cada grande momento de adoção tecnológica, há um ponto de inflexão No computador pessoal, Macintosh (1984) e Windows 3.0 (1990); na internet, o IPO da Netscape (1995); no mobile, a App Store do iPhone (2008); na nuvem, a AWS (2006~09); em AI, NVIDIA A100 (2020) e ChatGPT (2022) foram gatilhos decisivos Em 2025, o surgimento da chinesa DeepSeek deu o sinal de largada para a intensificação da competição global em AI Os recursos para sustentar o crescimento da AI vêm do enorme fluxo de caixa das gigantes de tecnologia e do capital global A combinação de competição intensa, capital e espírito empreendedor acelera o avanço da AI Ainda assim, segue incerto qual será o modelo de negócio vencedor no fim Technology Disruption Pattern Recognition = Hundreds of Years of Consistent Signals Na história da inovação tecnológica, repete-se o ciclo de superaquecimento inicial, entrada de capital, intensificação da competição e separação entre vencedores e perdedores Exemplos: ferrovias no século XIX, a bolha dos anos 1840, colapso das expectativas etc. Tecnologias que exigem grandes aportes de capital costumam ter retornos decepcionantes no início, mas, quando dão certo, mudam a estrutura industrial no longo prazo Porém, se não estiverem protegidas da concorrência, embutem alto risco O vencedor final nem sempre é quem tem a melhor tecnologia, mas quem leu com mais clareza o movimento do mercado e da indústria Em mercados sem barreiras de entrada, a vantagem de pioneirismo desaparece rapidamente Vale relembrar a lição: “É difícil prever os vencedores de uma nova tecnologia, mas é fácil ver os perdedores” AI-Related Monetization = Very Robust Ramps Evolução da estratégia de hardware para AI: o comando sobre o design de chips está migrando dos vendors tradicionais para as empresas de plataforma As GPUs da NVIDIA vêm atuando há muito tempo como o motor básico de treinamento/inferência em AI, garantindo uma posição incomparável Devido à explosão da demanda, mesmo com a rápida expansão da produção pela NVIDIA, a escassez de oferta continua, e hyperscalers e provedores de nuvem estão diversificando a cadeia de suprimentos Ascensão dos chips customizados (ASICs): acelera a adoção de ASICs otimizados para operações específicas de AI em comparação com GPUs de uso geral Os chips TPU do Google e Trainium da Amazon estão se consolidando como elementos centrais do stack de AI de cada empresa O Amazon Trainium2 oferece preço/desempenho 30% a 40% superior em relação a GPUs comuns, permitindo reduzir o custo de inferência em larga escala Esses chips customizados não são apenas experimentos, mas uma estratégia central para desempenho, economia e controle de arquitetura Amplia-se o esforço para melhorar a economia da infraestrutura de AI Andy Jassy, CEO da Amazon: "A AI não precisa necessariamente ser tão cara quanto é agora, e no futuro ficará mais barata" O silício customizado é um dos principais meios para reduzir os custos da infraestrutura de AI Crescimento de empresas especializadas em infraestrutura de AI CoreWeave: cresceu rapidamente ao reorganizar uma cadeia de suprimentos de hardware de games e cripto em uma nuvem de GPUs para AI Oracle: fez a transição do IT tradicional para uma plataforma de nuvem com GPUs especializada em AI Astera Labs: fornece interconexões de altíssima velocidade entre GPU e memória, ajudando a superar limites de desempenho em modelos de grande escala Essas empresas não desenvolvem diretamente modelos fundacionais, mas constroem a infraestrutura essencial desse ecossistema Com o aumento explosivo da demanda por computação, velocidade, disponibilidade e eficiência emergem como fatores centrais de competitividade AI Monetization = Chips As receitas de chips de AI de grandes empresas como NVIDIA, Google e Amazon estão crescendo rapidamente A receita trimestral da NVIDIA cresceu 78% na comparação anual, ultrapassando US$ 39 bilhões, com foco principal na divisão de data center Nos últimos 10 anos, a receita da NVIDIA cresceu 28 vezes, e os investimentos em CapEx + P&D das big techs dos EUA (Apple, Microsoft, Alphabet, Amazon, Meta e NVIDIA) também aumentaram 6 vezes A receita de TPUs (Tensor Processing Units) do Google é estimada em US$ 8,9 bilhões, com crescimento anual de 116% O Google TPU é um chip ASIC especializado no treinamento de modelos de AI, com mais de 100 mil unidades produzidas de forma acumulada desde o lançamento da primeira versão em 2015 A receita dos chips AWS Trainium da Amazon deve crescer 216% ao ano, chegando a US$ 3,6 bilhões em 2025 O Trainium2 oferece vantagem de preço/desempenho de 30% a 40% em relação a instâncias tradicionais baseadas em GPU, com desempenho até 4 vezes maior Contexto do crescimento do mercado de chips de AI Com o rápido aumento da demanda por treinamento e inferência de AI, a procura por chips de alto desempenho como GPUs e ASICs está explodindo As principais empresas de nuvem e hyperscalers estão concentradas em fortalecer o design de chips próprios e a cadeia de suprimentos, elevando a competitividade de preços e a eficiência da infraestrutura Chips especializados em AI, como GPU, TPU e Trainium, estão se consolidando como a principal fonte de receita dos data centers e como fator decisivo da competitividade da infraestrutura de AI AI Monetization = Compute Services Crescimento do mercado de serviços de computação para AI A receita de 2024 da CoreWeave, empresa de nuvem especializada em infraestrutura de AI, cresceu 730% na comparação anual, chegando a US$ 1,9 bilhão O crescimento do negócio foi acelerado por grandes contratos com clientes importantes como a OpenAI, IPO e a aquisição da Weights & Biases Com a explosão da demanda por infraestrutura de nuvem de alto desempenho para workloads de AI, segue o crescimento ultrarrápido de receita das empresas fornecedoras de infraestrutura Expansão do mercado de infraestrutura de AI A receita de infraestrutura de AI da Oracle cresceu 50 vezes em dois anos, alcançando US$ 950 milhões em 2024 (estimativa da Morgan Stanley) Com o aumento da demanda por infraestrutura de AI, há grandes novos contratos de clientes em espera, além de reservas expressivas que ainda não foram efetivamente atendidas O CEO da Oracle mencionou que, com a corrida de clientes por infraestrutura de AI, há “mais de 40 novos contratos acima de US$ 1 bilhão” Crescimento da conectividade de infraestrutura de AI A Astera Labs registrou crescimento de 242% na receita em 2024 na comparação anual, atingindo US$ 396 milhões Sua linha de produtos de conectividade de alta velocidade, como PCIe, CXL e Ethernet, está sendo aplicada em vários clientes e plataformas, consolidando-se como infraestrutura essencial dentro de data centers de AI, incluindo conectividade de GPU e clusters de aceleradores de AI no backend Coleta de dados para AI e supercomputação A Tesla aumentou sua capacidade de treinamento de AI em 8,5 vezes em relação a junho de 2021 (base de setembro de 2024), com o supercomputador Dojo e adoção em larga escala de GPUs O Dojo é avaliado como tendo enorme potencial não só para inovar no custo de treinamento interno, mas também para se transformar em um serviço externo, como a AWS Elon Musk afirmou que “o potencial do Dojo é muito grande” AI Monetization = Data Layer A monetização da camada de dados para AI está se acelerando A Scale AI aumentou a receita em 160%, de US$ 335 milhões em 2023 para US$ 870 milhões em 2024 Fornece infraestrutura essencial para a expansão de LLMs de fronteira, incluindo rotulagem de dados, avaliação e construção de pipelines Apresentou a visão de que “abundância de dados é uma escolha, e não deixaremos os limites da AI serem definidos pela escassez de dados” Garantiu mais de US$ 1,5 bilhão em novos contratos apenas em 2024 A VAST Data alcançou US$ 2 bilhões em receita acumulada entre janeiro de 2019 e maio de 2025 Simplifica a camada de infraestrutura de AI e fornece serviços de armazenamento, gerenciamento e processamento de dados Com a ascensão dos modelos de AI Reasoning, a importância da infraestrutura de dados ganha destaque Ressaltou que “para realizar o maior potencial na era da AI, o essencial é simplificar os problemas fundamentais” Alto crescimento de receita, enorme consumo de caixa, alta valorização, grande volume de investimento = boa notícia para o consumidor, para o resto ainda é incerto À medida que cresce a base global de usuários digitais e aumenta o potencial de explosão no uso, a área de investimento corporativo está se tornando cada vez mais competitiva e intensiva em capital A destruição criativa do ciclo tecnológico da AI mostra semelhanças com o processo de crescimento das grandes empresas de TI do passado Casos de grandes empresas de tecnologia do passado, como Apple, Amazon, Google, Uber e Tesla: Apple: saiu de um valor de mercado de US$ 1,7 bilhão em 1997, à beira da falência, para US$ 3,2 trilhões hoje Amazon: prejuízo de US$ 545 milhões em 2000, prejuízo acumulado de US$ 3 bilhões ao longo de 27 trimestres após a fundação; nos 27 trimestres mais recentes, registrou US$ 176 bilhões em lucro líquido, com valor de mercado de US$ 2,2 trilhões Google: na época do IPO em 2004, investia 22% da receita de US$ 390 milhões em CapEx, e foi de US$ 23 bilhões em valor de mercado no IPO para US$ 2 trilhões hoje Uber: queimou US$ 17 bilhões em caixa entre 2016 e 2022, teve seu primeiro lucro em 2023, e passou de US$ 82 bilhões em valor de mercado no IPO para US$ 189 bilhões hoje Tesla: queimou US$ 9,2 bilhões entre 2009 e 2018; após seu primeiro lucro em 2019, registrou US$ 40 bilhões de lucro líquido em cinco anos, com valor de mercado atual de US$ 1,1 trilhão Todas essas empresas suportaram investimentos agressivos e prejuízos de longo prazo para construir efeitos de rede baseados em dados e vantagens competitivas baseadas em tecnologia, provando no fim seu valor no mercado No fim das contas, o valuation corporativo deve ser justificado pelo valor presente do fluxo de caixa livre futuro No campo da AI, também será o tempo que provará quais players conseguirão gerar receita sustentável Usage + Cost + Loss Growth = níveis sem precedentes… e a monetização e os lucros do futuro? AI Monetization Possibilities = New Entrants & / Or Tech Incumbents? Para entender para onde vai a estrutura econômica dos modelos de AI, é preciso observar a tensão entre capacidade e custo O treinamento de LLMs gigantescos é uma das tentativas mais caras da história da humanidade, e os custos estão disparando para a casa dos bilhões de dólares com o aumento dos parâmetros e da complexidade da arquitetura Por outro lado, o custo de inferência (Inference) está caindo drasticamente graças à inovação em hardware e à eficiência algorítmica Exemplo: a GPU Blackwell 2024 da NVIDIA reduziu a energia por token em 105.000 vezes em comparação com a Kepler de 2014 À medida que a inferência fica mais barata, a competição entre fornecedores de LLM em precisão, latência, disponibilidade e custo por token se intensifica, e tarefas antes caras agora passam a ser viáveis a custo quase desprezível Para usuários e desenvolvedores, a queda no custo unitário se torna uma oportunidade, impulsionando uma explosão de novos serviços e casos de uso Já para os fornecedores de modelos, a monetização e o modelo de lucro ficam mais incertos O treinamento continua caro, mas a entrega (serving) fica mais barata, enfraquecendo o poder de precificação O surgimento do mercado de modelos pequenos customizados enfraquece os moats tradicionais de negócio Exemplo: o Google introduziu o AI Overviews na busca em maio de 2024 (1,5 bilhão de MAU em abril de 2025) e recentemente começou a aplicar anúncios em parte dele Daqui para frente, a competição deve acelerar em estratégias de plataforma (expansão horizontal), aplicações especializadas e diversos modelos de monetização, como assinatura e publicidade No curto prazo, a economia dos LLMs de uso geral está se aproximando cada vez mais de prejuízos em nível de venture e da competição por comoditização AI – New Entrants = Rapidly Laying Groundwork Situação da adoção de modelos de assinatura para consumidores pelos principais provedores de modelos fundacionais de IA (em maio de 2025) Diversos modelos, como OpenAI ChatGPT, xAI Grok, Google Gemini, Anthropic Claude e Perplexity, oferecem planos gratuitos/pagos por assinatura OpenAI ChatGPT: $0 (gratuito) / $20 (Plus) / $200 (Pro) (por mês) xAI Grok: $0 (gratuito) / $3 (Basic) / $8 (Premium) / $40 (Premium+) (por mês) Google Gemini: $0 (gratuito) / $19.99 (AI Pro) / $250 (AI Ultra) (por mês) Anthropic Claude: $0 (gratuito) / $17 (Plus) / $100 (Max) (por mês) Perplexity: $0 (gratuito) / $20 (Pro) (por mês) Situação da adoção de planos de preços de API para desenvolvedores pelos provedores de modelos fundacionais de IA (em maio de 2025) OpenAI, xAI Grok, Google Gemini, Anthropic Claude e Perplexity cobram valores por unidade de chamada de API OpenAI ChatGPT: $0.40 por 1 milhão de tokens (GPT-4.1 nano) ~ $40 (o3) xAI Grok: $0.50 por 1 milhão de tokens (grok-3-mini-beta) ~ $25 (grok-3-fast) Google Gemini: $0.15 por 1 milhão de tokens (1.5 Flash-8B) ~ $15 (2.5 Pro Preview) Anthropic Claude: $1.25 por 1 milhão de tokens (Claude 3 Haiku) ~ $75 (Claude 3 Opus) Perplexity: $1 por 1 milhão de tokens (Sonar) ~ $15 (Sonar Pro) AI – New Entrants = Rapid Revenue Growth Crescimento no número de assinantes pagos e na receita anual da OpenAI (outubro de 2022 ~ abril de 2025) O número de assinantes pagos do ChatGPT cresceu 153% ao ano, chegando a cerca de 20 milhões em abril de 2025 A receita anual da OpenAI cresceu 1050%, ultrapassando US$ 3,7 bilhões em abril de 2025 A receita anualizada da Anthropic baseada em API e busca generativa cresceu 20x em 18 meses (US$ 2 bilhões) Estratégia de novos modelos centrados em reasoning, como Claude 3.7 Sonnet, e ampliação do uso de IA voltado a tarefas reais de trabalho Crescimento de 6,4x em 1 ano A receita anualizada da Perplexity baseada em busca generativa cresceu 7,6x em 14 meses (US$ 120 milhões) Destaque para a oferta de fontes de referência em todas as respostas e para a função de assistente de pesquisa personalizado A receita anualizada da Glean com busca corporativa e agentes cresceu 10x em 24 meses (US$ 100 milhões) Projetada para apoiar a adoção de IA por grandes empresas e permitir o uso do conhecimento de toda a organização Empresas de IA (top 100) levam em média 24 meses para alcançar receita anualizada de US$ 5 milhões Ritmo 35% mais rápido que empresas SaaS tradicionais (média SaaS de 37 meses, média IA de 24 meses) AI –Tech Incumbents = Broad & Steady Product / Feature Rollouts Situação global de usuários e dispositivos de IA dos Tech Incumbents, em comparação com os usuários do ChatGPT (800 milhões) Google, Meta, Apple, TikTok, Microsoft, Spotify, Amazon, X, Canva e outras empresas estão expandindo gradualmente seus produtos de IA com base em centenas de milhões a bilhões de usuários Canva – Background Remover & Magic Media (12/19) O recurso de remoção de fundo de imagem, lançado em 2019, manteve popularidade constante e já foi usado mais de 3 bilhões de vezes no total O Magic Media (texto→imagem/vídeo), lançado em 2024, gerou mais de 290 milhões de criações em apenas 1 ano, mostrando forte resposta da comunidade Spotify – AI DJ (2/23) Recursos inovadores como AI DJ e videoclipes com IA foram lançados globalmente a partir de fevereiro de 2023 e, em maio de 2024, já estavam disponíveis em mais de 60 países O AI DJ eleva a satisfação dos usuários e a qualidade do serviço do Spotify com recomendações musicais personalizadas, interação e funcionalidades de reasoning em tempo real baseadas em dados Microsoft – Copilot (2/23) A Microsoft introduziu o Copilot no Bing e no Edge em fevereiro de 2023 e registrou mais de 15 bilhões de conversas acumuladas até dezembro de 2024 O Copilot oferece uma nova experiência de usuário baseada em IA em busca na web, navegador e ferramentas de escritório, contribuindo para maior eficiência e criatividade no trabalho diário Meta Platforms – Meta AI (9/23) Em abril de 2025, o Meta AI estava próximo de 1 bilhão de usuários ativos mensais (MAU) somando todos os apps, como Instagram, Messenger e WhatsApp A estratégia futura enfatiza liderar o desenvolvimento de agentes de IA no nível de engenheiros intermediários e garantir protagonismo em pesquisa e aplicação de IA no campo X – Grok (11/23) Com o lançamento da versão 3.0 em fevereiro de 2025, o Grok da xAI viu os visitantes globais de desktop saltarem 42x em relação ao mês anterior, superando 150 milhões Há ênfase na busca da verdade pela IA (value alignment) e na implantação em larga escala, enquanto a experiência de IA continua se expandindo dentro da plataforma X Google – Gemini & AI Overviews (12/23) Em maio de 2024, o chatbot Gemini tinha 400 milhões de MAU, enquanto o AI Overviews, embutido na busca do Google, alcançou 1,5 bilhão de usuários mensais Os pontos fortes estão no modelo de IA multimodal que abrange vários tipos de dados (texto, código, imagem, áudio etc.) e nos resumos com IA dentro da busca Amazon – Rufus (2/24) A Amazon introduziu o Rufus AI no varejo da América do Norte em fevereiro de 2024, melhorando recomendações personalizadas em informações de produtos e resumos de avaliações Junto com o crescimento do GMV do negócio de varejo, o uso de IA continua se ampliando TikTok – Symphony AI Assistant (6/24) Desde a introdução do Symphony Assistant em junho de 2024, o site global do TikTok registrou mais de 2 bilhões de visitantes A IA tem gerado resultados concretos em criação de conteúdo para marcas e criadores, eficiência de anúncios e afinidade com a marca Apple – Apple Intelligence (10/24) Entre setembro de 2024 e março de 2025, as vendas de dispositivos compatíveis com Apple Intelligence, como iPhone 15 Pro/Pro Max e a linha iPhone 16, chegaram a 50 milhões ~ 70 milhões de unidades O foco está em oferecer experiências de IA baseadas em personalização, privacidade e computação local por meio da integração entre hardware e software AI –Tech Incumbents = Rapid Revenue + Customer Growth Receita de produtos de IA da Microsoft Em 2024, a estimativa de receita anual da divisão de produtos de IA da Microsoft chegou a US$ 13 bilhões, alta de 175% em relação ao ano anterior Diversas linhas de produtos de IA, como Azure AI Services, Microsoft 365 Copilot e Dynamics 365 Copilot, impulsionaram o crescimento da receita O CEO Satya Nadella afirmou que a empresa “está ajudando a concretizar o retorno sobre investimento (ROI) em IA e aproveitando uma enorme oportunidade” Na divulgação de resultados do 1º trimestre de 2025, destacou que as reservas comerciais (Commercial bookings) cresceram 18% xAI: busca generativa Em 2025, a receita anual da xAI deve começar a crescer de forma significativa O modelo mais recente, Grok 3, baseado no supercomputador Colossus, alcançou melhorias de desempenho em tarefas avançadas de raciocínio, matemática, programação e conhecimento, com mais de 10 vezes a capacidade computacional O CEO Elon Musk enfatizou que se trata de uma “IA orientada à busca da verdade, mesmo que seja uma verdade politicamente incômoda” Clientes comerciais da Palantir nos EUA A Palantir alcançou 432 clientes comerciais nos EUA, com crescimento de 65% em um ano Sua plataforma de IA, AIP (Artificial Intelligence Platform), contribuiu para conquistar novos clientes e expandir a base existente Em base anual de 2025, a receita comercial nos EUA ultrapassou US$ 1 bilhão A competitividade da Palantir está em “maximizar o contexto dentro das empresas por meio da AI Ontology e oferecer capacidade de execução diferenciada” Possibilidades de monetização de IA – Enterprise = plataforma horizontal e/ou software especializado? Direção da monetização de IA no mercado corporativo O software empresarial tradicional cresceu como ferramentas especializadas para setores e funções específicas (Vertical SaaS) Soluções especializadas por setor, como Toast (restaurantes), Guidewire (seguros) e Veeva (ciências da vida), lideram seus respectivos mercados No entanto, com o surgimento dos modelos fundacionais e da IA generativa, novas oportunidades de monetização estão se abrindo em várias áreas Ascensão das plataformas horizontais Estão surgindo plataformas corporativas horizontais que integram produtividade nativa em IA, busca, comunicação e gestão do conhecimento em uma única interface Exemplo: um formato que combina Slack + Notion + ChatGPT, incorporando inteligência de IA ao contexto de trabalho de toda a organização em vez de manter SaaS isolados Há uma migração de valor da venda de licenças SaaS para modelos de cobrança baseados em resultados gerados com IA embutida Competição entre plataformas horizontais e software especializado A Microsoft está integrando o Copilot em toda a empresa, enquanto Zoom e Canva incorporam IA generativa aos fluxos de trabalho dos usuários Empresas como a Databricks estão integrando IA à pilha de dados e de desenvolvedores Startups como a Glean desafiam o modelo tradicional de suíte com fluxos de trabalho AI-first Por outro lado, fornecedores tradicionais de software especializado também estão reagindo, incorporando IA, automatizando fluxos de trabalho e adotando rapidamente modelos personalizados com dados específicos de cada setor Esses fornecedores especializados já contam com confiança, dados estruturados e fluxos de trabalho de campo, o que lhes dá vantagem na implantação de IA especializada por domínio Perspectivas futuras As plataformas horizontais têm força na integração de múltiplas funções e conexão do conhecimento em toda a empresa Fornecedores especializados se diferenciam com recursos de IA profundos adaptados a regulamentações, contratos e contexto de clientes de cada setor A questão central será quem conseguirá abstrair a camada principal e dominar a interface do usuário e a lógica de trabalho Na era da IA, a monetização será definida não pelo uso simples, mas por “Attention”, “Context” e “Control” Incumbentes de SaaS Microsoft GitHub Copilot Lançamento oficial em junho de 2022 Adotado por mais de 77.000 empresas Crescimento de 180% ano contra ano ao longo de 2 anos Comunidade de 150 milhões de desenvolvedores, alta de 50% em 2 anos Mais de US$ 500 milhões em receita anual (em base trimestral) Microsoft 365 Copilot Anunciado em março de 2023, com oferta comercial geral para empresas iniciada em novembro de 2023 Já no 1º trimestre após o lançamento, muitos clientes existentes ampliaram o número de assentos em mais de 10 vezes O número de usuários mais que dobrou a cada trimestre A taxa de uso pelos funcionários também disparou, com aumento recente de mais de 60% Mais de 75% dos CIOs planejam adotar a ferramenta nos próximos 12 meses Adobe Firefly Beta público em março de 2023; modelo de vídeo com IA comercializado em fevereiro de 2024 Bem avaliado por marcas e criadores O total de ativos gerados no Firefly ultrapassou 20 bilhões Mais de 90% dos usuários pagos já experimentaram geração de vídeo Usuários ativos mensais de GenAI no Photoshop e Lightroom chegaram a 35% e 30%, respectivamente Atlassian Intelligence Beta em dezembro de 2023; ultrapassou 1 milhão de MAU em dezembro de 2024 Em um ano, o uso dos recursos de IA cresceu 25 vezes Mais de 10% dos clientes adotaram o Atlassian Intelligence Zoom AI Companion Lançado em setembro de 2023; 3,5 milhões de contas adotaram a ferramenta até dezembro de 2024 O número de contas ativas cresceu 68% trimestre a trimestre O AI Companion 2.0 oferece recursos avançados como memória, raciocínio e integrações Canva Magic Studio Lançado em outubro de 2023; uso acumulado das ferramentas de IA chegou a 16 bilhões de vezes em maio de 2025 Utilizado por toda a comunidade de criadores, empresas e organizações sem fins lucrativos Mais de 10 bilhões de usos registrados das ferramentas de IA Salesforce Agentforce Anunciado em setembro de 2024; até fevereiro de 2025, fechou 3.000 contratos pagos Em conjunto com o Data Cloud, impulsiona inovação em experiência do cliente em larga escala Mantém crescimento de ARR de IA acima de 120% ao ano OpenAI ChatGPT = potencial plataforma horizontal corporativa? Microsoft Office Suite Composto por 9 aplicativos (Outlook, Word, Excel, PowerPoint etc.) Conquistou mais de 400 milhões de usuários pagos ao longo de 34 anos (1990–2024) OpenAI ChatGPT Apesar de ser um único aplicativo, alcançou 20 milhões de usuários pagos em apenas 2,5 anos (novembro de 2022–abril de 2025) Expansão do ChatGPT Enterprise Em 9 meses após o lançamento, foi adotado por equipes em mais de 80% das empresas da Fortune 500 As empresas usuárias responderam que preferem a facilidade de implantação e o modelo seguro As empresas que adotaram a ferramenta no início usam ativamente o ChatGPT Enterprise para melhorar a comunicação interna, acelerar tarefas de programação, responder rapidamente a perguntas de negócios complexas e apoiar trabalho criativo O ChatGPT Enterprise não tem limites de uso e oferece desempenho até 2 vezes mais rápido que a versão gratuita Também oferece acesso ilimitado a recursos de análise avançada de dados (antigo Code Interpreter) Entre agosto de 2023 e fevereiro de 2025, o número de usuários corporativos/de equipe/educacionais cresceu rapidamente para 2 milhões Software especializado habilitado por IA em grandes setores de serviços = crescimento muito rápido Engenharia de software Cursor AI: atingiu ARR (receita recorrente anual) de $1M → $300M em 25 meses O Cursor é um editor de código com IA que oferece uma experiência de usuário inovadora em escrita de código, refatoração e automação Mais de 1 bilhão de caracteres editados por dia, com mais de $100M em receita recorrente registrada Desenvolvimento de produto (No-Code Product-Building) Lovable: crescimento de 13x no ARR em 5 meses, alcançando $50M Plataforma no-code baseada em IA que gera automaticamente código front-end/back-end, integração com DB e implantação a partir de ideias de produto em linguagem natural Ajuda qualquer pessoa a criar produtos rapidamente e começar um negócio Saúde (conversas clínicas) Abridge: crescimento de CARR (receita recorrente contratada) de $50M → $117M em 5 meses Adotado por cerca de 25.000 profissionais de saúde, 40 hospitais e 600 instituições médicas; usado mais de 10 milhões de vezes para resumir registros de consultas de pacientes Muitos feedbacks positivos dos profissionais de saúde que utilizam a solução Jurídico (automação de workflow) Harvey: crescimento de ARR de $10M → $70M em 15 meses, com 235 clientes em 42 países Adotado pela maioria dos 10 maiores escritórios de advocacia dos EUA, liderando a automação de workflows jurídicos/serviços profissionais e a inovação em eficiência Suporte ao cliente (AI Support Agents) Decagon: crescimento de ARR de cerca de $1M → $10M em 1 ano Agentes de suporte com IA automatizam tarefas repetitivas, e as funções de atendimento ao cliente migram para o papel de gerente de IA Perspectiva de crescimento adicional em 2025 Serviços financeiros (pesquisa e análise) AlphaSense: crescimento de ARR de cerca de $150M → $420M em 2 anos Insights baseados em IA estão se consolidando como padrão de mercado, oferecendo soluções avançadas de inteligência de mercado e workflow Foco em inovação de produto e investimento em tecnologia, com continuidade do alto crescimento em 2025 Ameaças à monetização da IA = aumento da concorrência + impulso do open source + ascensão da China Aumento da concorrência = lançamentos de modelos de IA Desde o artigo sobre transformadores do Google de 2017, “Attention is All You Need”, começou a primeira onda de inovação em IA centrada em LLMs (grandes modelos de linguagem) O GPT-3 da OpenAI e o Llama-1 da Meta, entre outros, comprovaram o potencial de capacidades gerais de raciocínio por meio do treinamento em predição de texto em larga escala No entanto, a comunicação humana não se limita apenas a texto Imagens, áudio, vídeo, dados de sensores e outros sinais transmitem com muito mais riqueza o contexto das situações reais Empresas como Google, Anthropic e xAI estão expandindo os modelos de linguagem para o multimodal (processamento de múltiplos formatos de dados) Evolução dos modelos de IA multimodais Integram texto, fotos, voz e vídeo em um único espaço vetorial para compreensão e geração Para uma única consulta, podem considerar ao mesmo tempo parágrafos + gráficos, e devolver a resposta como resumo em áudio ou imagem anotada Estrutura que transita livremente entre todos os formatos de dados sem necessidade de trocar de sistema Principais exemplos de evolução por etapa 2021 OpenAI CLIP: integração de visão + linguagem 2023 Meta ImageBind, 2024 Chameleon: fusão de imagem, voz e vídeo 2024-2025 GPT-4o, Claude 3, Chameleon: surgimento de modelos de fronteira totalmente multimodais Efeitos práticos no mundo real Engenheiros em campo verificam em tempo real diagnósticos de anomalias em equipamentos usando a câmera do smartphone Profissionais de saúde geram rascunhos estruturados de relatórios clínicos ao mesmo tempo em que anexam radiografias Analistas consultam gráficos, transcrições e clipes de áudio de uma só vez para análise integrada Menos troca de contexto em comparação com modelos baseados em texto, captura de informação mais rica e inovação em serviços centrados em visão e voz Impulso dos modelos open source O desenvolvimento de modelos de IA, no início (2012-2018), foi centrado em open source Com base na academia e na cultura de colaboração, modelos, código e dados eram publicados Desde 2019, com comercialização, segurança e concorrência intensificada, surgiram os modelos fechados (closed source) A partir do lançamento do GPT-2, pesos e dados de treinamento dos principais modelos passaram a ser mantidos em sigilo OpenAI GPT-4, Anthropic Claude e outros operam como APIs, apoiados em grandes volumes de dados proprietários e capital intensivo Têm força em desempenho, usabilidade e confiabilidade, por isso são preferidos por grandes empresas, governos e consumidores Por outro lado, a falta de transparência sobre dados de treinamento, arquitetura do modelo e métodos de fine-tuning é uma limitação Recentemente, os modelos open source voltaram a ganhar força Têm baixo custo de desenvolvimento e uso, além de alta acessibilidade, o que os torna populares entre startups, desenvolvedores e academia Em plataformas como Hugging Face, é fácil baixar e usar modelos recentes como Meta Llama e Mistral Mixtral O desenvolvimento de IA volta a se expandir dos grandes laboratórios para laboratórios individuais e comunitários Experimentação rápida, colaboração e participação da comunidade aceleram a inovação A China é líder mundial em 2025 no número de grandes modelos de IA open source divulgados Grandes modelos lançados em 2025 incluem DeepSeek-R1, Alibaba Qwen-32B e Baidu Ernie 4.5 Diferenciação clara entre closed source e open source Open source: lidera IA soberana, modelos de linguagem localizados e inovação baseada em comunidade Closed source: mantém vantagem no mercado consumidor e na adoção por grandes empresas, com foco em otimização e usabilidade Esses dois paradigmas — abertura/velocidade/liberdade versus segurança/otimização/controle — competem entre si e moldam o futuro da IA Melhor desempenho dos modelos open source + queda no custo por token = explosão no uso por desenvolvedores que usam IA No início, modelos closed source como GPT-4, Claude e Gemini lideravam os mercados consumidor e corporativo Com onboarding simples, UI/UX refinada e alta confiabilidade, tinham vantagem em percepção pública e adoção empresarial Ofereciam segurança, conveniência e reconhecimento de marca que até profissionais não técnicos conseguiam usar facilmente Recentemente, a diferença de desempenho dos modelos open source diminuiu rapidamente Llama 3, DeepSeek e outros atingiram um nível competitivo com modelos fechados em raciocínio, programação e multilinguismo Podem ser baixados livremente, ajustados com fine-tuning e implantados localmente, com custo muito menor A adoção de modelos de IA open source está acelerando entre desenvolvedores Desenvolvedores preferem customização e baixo custo/alto desempenho a uma UX extremamente refinada Há intensa experimentação e inovação com base em modelos open source em apps, agentes, pipelines e várias outras áreas Com a queda no preço dos tokens e a melhora de desempenho dos modelos open source, o número de desenvolvedores usando IA cresce de forma explosiva Antes havia alta dependência de APIs fechadas, mas agora já é possível construir e escalar diretamente tanto em ambientes locais quanto na nuvem Ainda há limites para a popularização entre consumidores e grandes empresas Open source ainda tem pontos fracos em poder de marca, UX amigável e serviços gerenciados Mas, se a infraestrutura ficar mais conveniente e a vantagem de custo/desempenho se mantiver, há potencial de expansão também para o mercado de massa Ascensão da China O CTO da Meta, Andrew Bosworth, compara atualmente a IA a uma “corrida espacial (space race)” e avalia de forma muito alta, em especial, as capacidades da China Assim como a corrida espacial do passado tinha um caráter de competição entre sistemas (velocidade de inovação e credibilidade global), a disputa por IA também pode influenciar a ordem mundial A China, a partir da política ‘Made in China 2025’ (Made in China 2025), passou rapidamente de manufatura de baixo custo para líder em tecnologias avançadas Fortalecendo rapidamente suas capacidades em indústrias estratégicas, com foco em robótica, eletrificação, tecnologia da informação e inteligência artificial de nível mundial Aplicação militar e estratégica nacional da IA chinesa O uso de IA está se expandindo por toda a segurança nacional, incluindo logística de campo de batalha, reconhecimento de alvos, operações cibernéticas e plataformas autônomas de tomada de decisão Em 2025, a mídia estatal também destacou a aplicação de IA em áreas de apoio militar (não combate), como hospitais militares O Ministério da Ciência e Tecnologia deixou claro que ‘inovação autóctone (indigenous innovation)’ é uma tarefa central do país Impacto global da vantagem chinesa em IA Sam Altman, da OpenAI, alertou em um artigo de 2024 que “se regimes autoritários assumirem a liderança em IA, poderão forçar empresas dos EUA e de outros países a compartilhar dados, além de usar IA para vigilância da própria população ou desenvolvimento de armas cibernéticas” Aprofundamento da disputa por hegemonia tecnológica entre EUA e China A disputa pelo controle não envolve apenas IA, mas também terras raras, semicondutores e setores de tecnologia avançada A China mantém sua posição como potência global no fornecimento de terras raras (matéria-prima essencial para eletrônicos avançados, defesa e energia limpa), enquanto os EUA tentam conter isso por meio de reshoring de semicondutores (retorno da produção ao país) e do fortalecimento da cooperação com aliados (Japão, Coreia do Sul, Países Baixos etc.) A TSMC, de Taiwan, ocupa um papel central na manufatura global de semicondutores e está no centro dos cálculos estratégicos de EUA e China Mudança de orientação política dentro dos EUA Depois de 20 anos de resposta morna, ambos os partidos passaram a reconhecer ativamente as indústrias de tecnologia avançada como ‘centrais para o interesse nacional’ Governo Biden: controles de exportação; governo Trump: nacionalismo econômico e reshoring, entre outras abordagens Os senadores John Cornyn e Mark Warner: “A inovação americana em semicondutores sustentou toda a economia, mas a complacência abriu espaço para que países concorrentes (inclusive adversários) se aproximassem” Importância da proteção da propriedade intelectual (IP) tecnológica dos EUA A OpenAI afirmou que “concorrentes como a China seguem tentando fazer engenharia reversa de modelos de IA líderes dos EUA, e uma cooperação estreita com o governo é indispensável” Mudança de visão sobre as relações entre EUA e China Diferentemente do início da adesão à OMC (anos 2000), os EUA de hoje reconhecem claramente que tecnologias avançadas como IA, semicondutores e minerais críticos são um eixo central não apenas de ativos econômicos e industriais, mas também da resiliência nacional e do poder geopolítico Public Market Capitalization Leader Tells of Last Thirty Years = Extraordinary USA Momentum…China Rising Nos últimos 30 anos (1995~2025), entre as 30 maiores empresas globais por valor de mercado, apenas 6 permaneceram continuamente na lista Microsoft, Walmart, Exxon Mobil, Procter & Gamble, Johnson & Johnson, Coca-Cola Empresas que entraram no topo posteriormente NVIDIA, Apple, Amazon, Alphabet(Google), Saudi Aramco, Meta Platforms(Facebook), Tesla, Broadcom, Berkshire Hathaway, TSMC, JP Morgan Chase, Visa, Eli Lilly, Tencent, Mastercard, Netflix, Costco Wholesale, Oracle, Home Depot, SAP, Bank of America, ICBC, AbbVie, Palantir Participação por país em 1995 EUA: 53% (16 das 30 empresas), Japão: 9, Suíça: 3, Reino Unido: 2 Participação por país em 2025 EUA: 83% (25 das 30 empresas) Japão/Suíça/Reino Unido: 0 China 2, Arábia Saudita 1, Taiwan 1, Alemanha 1 Nos últimos 30 anos, entre as 30 maiores empresas globais de tecnologia (tech companies) por valor de mercado, apenas 5 permaneceram continuamente na lista Microsoft, Oracle, Cisco, IBM, AT&T Novas entradas entre as empresas de tecnologia NVIDIA, Apple, Amazon, Alphabet(Google), Meta Platforms(Facebook), Tesla, Broadcom, TSMC, Tencent, Netflix, SAP, Palantir, ASML, Alibaba, Salesforce, T-Mobile, Samsung, China Mobile, Reliance, ServiceNow, Intuitive Surgical, Siemens, Uber, AMD, Intuit Participação por país entre empresas de tecnologia em 1995 EUA: 53% (16/30), Japão: 30% (9/30), Reino Unido/Singapura/Hong Kong/México/Malásia: 1 cada Participação por país entre empresas de tecnologia em 2025 EUA: 70% (21/30) Japão/Reino Unido/Singapura/Hong Kong/México/Malásia: 0 China 3, Alemanha 2, Taiwan 1, Países Baixos 1, Coreia do Sul 1, Índia 1 TSMC, de Taiwan: Taiwan tem apenas 1 empresa no topo (TSMC), mas, no 2º trimestre de 2024, produziu de 80% a 90% dos semicondutores avançados do mundo e mais de 62% de todos os semicondutores Uma transformação enorme ocorrida em apenas uma geração A popularização da internet serviu de base para o surgimento de novas empresas globais líderes e, projeta-se que a ascensão da IA acelere mudanças ainda mais rápidas e profundas nos próximos 30 anos EUA vs. China em tecnologia = tempo de resposta da IA da China significativamente mais rápido que o da internet em 1995 Liderança em grandes modelos de linguagem (LLM) de IA: Estados Unidos e China lideram o ritmo do desenvolvimento global de IA Ao observar a situação acumulada de construção de sistemas de IA de grande escala entre 2017 e 2024, Estados Unidos e China estão isolados na liderança Em 2024, os Estados Unidos anunciaram mais de 150 casos, e a China também divulgou mais de 100 sistemas de IA de grande escala França, Reino Unido, Canadá, Hong Kong e Alemanha ainda mostram uma grande distância em relação a Estados Unidos e China China AI = perseguição rápida, DeepSeek R1 A DeepSeek anunciou que a capacidade de desenvolvimento de IA da China reduziu a diferença para os Estados Unidos para apenas 3 meses (janeiro de 2025) O CEO da DeepSeek enfatizou que a China precisa inevitavelmente ir além da simples imitação e avançar para uma inovação própria Alibaba Qwen 2.5-Max: alega superar DeepSeek e OpenAI ChatGPT O Qwen2.5-Max demonstrou desempenho superior ao DeepSeek V3 e ao OpenAI ChatGPT em diversos benchmarks O desempenho do modelo continua melhorando por meio de inovações em escala de dados, tamanho do modelo e técnicas de pós-treinamento Baidu Ernie 4.5 Turbo: IA multimodal, baixo custo e alto desempenho Uma IA multimodal que processa texto, imagem e vídeo, comparada a um “canivete suíço” Custo de RMB 0.8 por 1 milhão de tokens de entrada e RMB 3.2 de saída, equivalente a 40% do custo do DeepSeek V3 e 0,2% do GPT-4.5 Apresentou desempenho equivalente ao GPT-4.1 e superior ao GPT-4o em algumas tarefas multimodais Desempenho de LLM: Estados Unidos e China, diferença real de pontuação está diminuindo Segundo os resultados do Chatbot Arena da Stanford HAI & LMSYS em fevereiro de 2025, os Estados Unidos marcaram 1.385 pontos e a China 1.362, mostrando proximidade IA chinesa: alcançando desempenho com menor custo de treinamento Segundo dados da Epoch AI, modelos chineses como o DeepSeek V3 foram lançados com custos significativamente menores que o GPT-4 Transição do treinamento de IA para semicondutores locais Com as restrições de exportação dos Estados Unidos, clusters locais de chips de IA, como os da Huawei, estão se expandindo rapidamente Segundo o Financial Times, a Huawei começou a fornecer em larga escala clusters de IA para empresas de tecnologia chinesas China: base de instalação de robôs industriais também está no nível mais alto do mundo Em 2023, a China registrou 276 mil unidades, o resto do mundo 265 mil, e os Estados Unidos em torno de 40 mil, mostrando uma diferença clara Conclusão: a velocidade da inovação em IA da China é muito mais rápida que a da fase inicial de adoção da internet (1995) A diferença em relação aos Estados Unidos está diminuindo rapidamente em tecnologia, custo e infraestrutura, enquanto a disputa pela liderança global da indústria fica ainda mais intensa Uso de IA para o consumidor na China = DeepSeek cresceu rapidamente O mercado global de IA generativa está se fragmentando cada vez mais por região, canal e preferência do usuário Globalmente, o ChatGPT da OpenAI ocupa uma liderança clara tanto em desktop quanto em mobile, mas a concorrência entre plataformas está se intensificando Claude, da Anthropic, e Google Gemini também estão ampliando gradualmente sua participação, enquanto o Grok, da xAI, foi registrado como o assistente de IA com crescimento mais rápido, com aumento mensal de 294% nas visitas entre fevereiro e março de 2025 Na China, modelos locais de IA como DeepSeek estão em alta O ChatGPT lidera na maioria dos países, mas, como não está disponível na Rússia e na China, modelos locais como o DeepSeek dominam Segundo a consultoria Roland Berger, os 10 principais apps de IA por usuários ativos mensais na China são todos nacionais (DeepSeek, Kimi, Nami AI, ERNIE Bot etc., com dezenas de milhões de usuários) No resto do mundo, excluindo a China, o ChatGPT é amplamente dominante; dentro da China, formou-se um mercado completamente separado Regulação e ambiente de plataformas na China Facebook, Twitter, Google e YouTube estão inacessíveis na China desde 2010 ou antes Além de Instagram, WhatsApp, Wikipedia, Telegram e Spotify, mais recentemente ChatGPT, Google Gemini, Claude, Meta AI e Microsoft Copilot também foram bloqueados Esse ambiente regulatório impulsionou o surgimento de campeões locais de IA Diferenças de percepção sobre a IA Segundo pesquisa da Stanford HAI e Ipsos, 83% dos cidadãos chineses avaliam positivamente o efeito líquido da IA (em 2024, alta de 5 pontos percentuais em relação a 2022) Entre os cidadãos dos Estados Unidos, apenas 39% responderam positivamente à mesma pergunta, sem grandes mudanças em dois anos Sob perspectivas sociais e filosóficas, a forma de abordar e aceitar a IA varia de país para país **A escolha de plataforma vai além de desempenho ou preço e se expande gradualmente para o campo da identidade nacional e cultural ** Já não se trata apenas de ‘quem faz melhor’, mas de ‘como isso é recebido e usado’, tornando-se um ponto de inflexão ainda mais importante IA & Mundo físico aceleram = rápido + orientado por dados Até agora, o foco esteve na difusão e monetização da IA em software para desktop/mobile, mas a inovação e a monetização da IA no mundo físico real estão se mostrando ainda mais rápidas e dramáticas Agora, a inteligência está profundamente incorporada não apenas em aplicações digitais, mas também em veículos, máquinas e sistemas de defesa Frotas de veículos autônomos como Waymo e Tesla já não são mais projetos de laboratório; estão gerando receita de fato, acumulando milhões de milhas de direção sem motorista e evoluindo rapidamente em loops de software cada vez mais sofisticados A Applied Intuition desenvolve sistemas de veículos definidos por software e plataformas de simulação independentes de hardware, permitindo que fabricantes apliquem inteligência artificial com a mesma facilidade de um componente Na indústria de defesa (Anduril), a IA está transformando o paradigma da defesa ao enviar sistemas autônomos com IA embarcada em cada nó de edge, como drones e sensores Na agricultura (Carbon Robotics), com visão computacional baseada em IA, ervas daninhas estão sendo removidas sem uso de herbicidas, marcando uma grande virada em que ativos de capital do mundo físico se tornam endpoints de software Isso sugere que a IA já não está restrita à tela e está se tornando uma força cinética que move a realidade Tesla Vertically-Integrated Electric Vehicles De junho de 2022 a março de 2025, a quilometragem acumulada de condução autônoma total (Full Self-Driving) cresceu 100x Com a introdução da versão 12, 330 mil linhas de código C++ foram substituídas por redes neurais, com adoção de uma arquitetura de IA end-to-end completa A IA desempenha papel central em todas as etapas, incluindo reconhecimento de objetos, planejamento de rota e controle do veículo É possível que a Tesla seja a empresa mais eficiente do mundo em inferência de IA Waymo Fully-Autonomous Vehicles De agosto de 2023 a abril de 2025, a participação no mercado de rideshare em San Francisco disparou de 0% para 27% Construção de um sistema comercial robusto com perception, planning e prediction baseados em IA multimodal Comprovou no mercado real um produto de veículo autônomo comercialmente viável Applied Intuition Vehicle Intelligence Em 2024, fornecia soluções de inteligência veicular com IA para 18 grandes OEMs automotivos globais Expansão da plataforma de simulação e do software de direção autônoma para diversos setores, incluindo automóveis, caminhões, construção e defesa No setor de defesa, fortaleceu sua linha de produtos de direção autônoma off-road e tecnologias militares Anduril AI-Enabled Autonomous USA Defense Systems Entre 2022 e 2024, dobrou a receita anual por dois anos consecutivos, superando US$ 1 bilhão em 2024 Usa IA e sistemas autônomos para apoiar decisões mais rápidas e precisas no ambiente moderno de campo de batalha Inova sistemas de segurança e defesa ao distribuir IA por cada nó de edge descentralizado KoBold Metals AI-Driven Mining Exploration Com tecnologia de machine prospector baseada em IA, melhorou dramaticamente a eficiência da exploração mineral, setor que mostrava a pior eficiência desde 1975 Combina grandes volumes de dados geográficos/geofísicos com modelos estatísticos de correlação para identificar rapidamente candidatos promissores à exploração Garante novas cadeias de suprimento de metais com mais do que o dobro da eficiência da média do setor Carbon Robotics AI-Driven Agricultural Modernization De janeiro de 2023 a maio de 2025, realizou capina em mais de 230 mil acres acumulados, evitando o uso de mais de 100 mil galões de glifosato (herbicida) Usa deep learning e visão computacional baseados em IA para eliminar ervas daninhas ao redor das plantações com laser Máquinas automatizadas conseguem cobrir 2 acres por hora e remover 200 mil ervas daninhas por dia Halter AI-Driven Intelligent Grazing Em 2025, o número de novos contratos de coleiras inteligentes para pecuária crescia mais de 150% ao ano, em média O manejo de pastagem baseado em IA melhora a eficiência no uso de recursos, a saúde do solo e a sustentabilidade Comprova efeitos de grande escala em produtividade e redução de carbono capazes de superar a lenta adoção de tecnologia na agricultura moderna Global Internet User Ramps Powered by AI from Get-Go = Growth We Have Not Seen Likes of Before Com a expansão da internet via satélite de baixo custo, cresce rapidamente a possibilidade de que 2,6 bilhões de pessoas desconectadas, equivalentes a 32% da população mundial, passem a entrar online Diferentemente das gerações anteriores, elas começarão sua primeira experiência de internet já com recursos de IA integrados por padrão Em vez de digitar diretamente na barra de busca ou passar por navegadores tradicionais, a tendência é que obtenham informação e usem diversos serviços tecnológicos conversando diretamente com a IA em linguagem natural Esse tipo de interface baseada em agentes de IA pode concentrar valor de mercado não nos apps, mas nos players que controlam a interface, abalando a hierarquia das plataformas existentes Daqui para frente, possuir a interface será mais importante do que possuir a plataforma, e a IA capaz de entender idioma local, contexto e intenção do usuário tende a ser a principal vantagem competitiva New Internet User Growth = Enabled by AI + Satellites Orbital / Satellite Launch Market Share, Global = SpaceX Rising Desde 2008, com o início de um renascimento dos lançamentos espaciais comerciais e nacionais, a SpaceX passou a ocupar grande participação no número anual de lançamentos EUA (sem contar a SpaceX), China e Rússia também mostram crescimento, mas o avanço acelerado da SpaceX se destaca Da Guerra Fria até o fim dos anos 1990, o setor era liderado por governos; recentemente, cresce a tendência de lançamentos liderados pela iniciativa privada SpaceX Starlink @ 5MM+ Subscribers = +202% Annual Growth Over 3.2 Years O Starlink aumentou sua base de assinantes de cerca de 100 mil em 2021 para mais de 5 milhões em 2024 Registrou taxa de crescimento anual média de 202%, expandindo rapidamente sua base global de usuários de internet SpaceX Starlink Ecosystem = Coverage Expanding Globally Em 2025, o Starlink expandiu sua área de serviço para América do Norte, América do Sul, Europa, Oceania, partes da África e principais regiões da Ásia Os países ainda sem serviço seguem sendo limitados, como China, Rússia e Irã Starlink = Unlocking Previously-Inaccessible Internet Access in AI Era Coco, Monterrey, Mexico: fornece internet de alta velocidade e confiável em área rural do México, ampliando a acessibilidade digital por meio de Wi‑Fi comunitário Chile School District: fornece internet de alta velocidade capaz de conectar simultaneamente todos os 36 computadores de uma escola no Chile, transformando o ambiente de aula para alunos e professores Brightline Trains, USA: oferece internet via satélite estável em trens de alta velocidade nos EUA, melhorando a experiência dos passageiros e a eficiência operacional Seaspan Corporation, Global: introduziu internet via satélite em uma empresa global de transporte marítimo, permitindo transformar navios em escritórios remotos, melhorar a segurança da tripulação e a eficiência operacional, e viabilizar soluções antes impossíveis AI & Work Evolution = Real + Rapid Mudança fundamental na natureza do trabalho com a adoção de IA Junto com a automação física, como robôs e drones, a automação cognitiva também está se espalhando rapidamente Sistemas de IA estão ampliando seu campo de atuação no trabalho ao adquirir capacidades de raciocínio, criação e resolução de problemas Velocidade de crescimento das capacidades cognitivas da IA Nos três anos desde o lançamento público do ChatGPT (novembro de 2022), evoluiu de um nível de ensino médio para capacidade de raciocínio em nível de doutorado Funções de regras e julgamento baseadas em grandes volumes de dados estruturados estão migrando para áreas em que a IA tem vantagem Mudança na unidade do trabalho Há possibilidade de transição do trabalho tradicional centrado em humanos para um modelo centrado no poder computacional de data centers e modelos de IA Está chegando uma era em que a infraestrutura de IA determinará a oferta e a qualidade de determinadas forças de trabalho Futuro baseado em agentes e o papel dos humanos Alguns projetam que agentes de IA substituirão empregos white-collar No entanto, é necessário considerar o padrão histórico em que, junto com ganhos de produtividade e eficiência, novos trabalhos humanos surgiram Mesmo em uma sociedade totalmente centrada em agentes, papéis humanos como supervisão, treinamento e orientação continuarão existindo Estrutura futura do trabalho e mudanças sociais Como no RLHF (aprendizado por reforço com feedback humano), os humanos podem migrar para funções de treinamento e ajuste fino do desempenho de IA e robôs Historicamente, mudanças na forma de trabalhar sempre se repetiram, e a IA também é uma tecnologia que impulsiona a produtividade e a evolução do trabalho Summary Assim como é difícil imaginar a vida sem internet, também deve se tornar impossível imaginar um mundo sem IA no futuro A IA está se consolidando rapidamente como infraestrutura central em toda a indústria, incluindo atendimento ao cliente, desenvolvimento de software, ciência, educação e manufatura Fatores que aceleram a popularização da IA A expansão global de ferramentas de IA multimodal como o ChatGPT, a queda no custo de raciocínio e o lançamento de diversos modelos estão impulsionando esse avanço De desenvolvedores solo a grandes empresas, o acesso e a experimentação ficaram mais fáceis, acelerando a disseminação da inovação Infraestrutura tecnológica e investimento Grandes provedores de nuvem, semicondutores e hyperscalers estão registrando forte aumento no investimento em capital Em chips, data centers, redes e sistemas de energia, a fronteira entre o físico e o digital está ficando cada vez mais difusa Competição estratégica entre EUA e China e liderança global em IA Os EUA lideram em inovação de modelos, chips customizados e infraestrutura de nuvem, mas a China também cresce rapidamente com open source, infraestrutura e apoio estatal Ambos os países veem a IA como alavanca central para o crescimento econômico e a influência geopolítica Mudanças em plataformas e interfaces A IA está evoluindo além do ecossistema tradicional de apps para interfaces conversacionais baseadas em agentes Graças à internet via satélite e afins, é alta a chance de que novos usuários da internet no futuro comecem já com uma experiência nativa de IA Mudanças nos empregos e na forma de trabalhar A adoção de IA no ambiente de trabalho está acelerando, com a unidade do trabalho migrando gradualmente de humanos para poder computacional e IA Cada vez mais pessoas trabalharão com IA, e a tendência de a IA reorganizar o ambiente de trabalho está ficando clara Combinação entre cenário internacional e tecnologia O fluxo de informação e capital, a militarização da tecnologia e o aprofundamento do confronto entre democracia e autoritarismo elevam a incerteza Ainda assim, a inovação é vista como elemento central da competitividade nacional, com destaque para a importância de execução rápida e estratégia de alianças Conclusão Chegou a hora do jogo da IA, e isso está ficando cada vez mais intenso O Genie (gênio) não voltará para a garrafa (já ultrapassamos um ponto sem volta)

(bondcap.com)

27 pontos por xguru 2025-06-02 | 1 comentários | Compartilhar no WhatsApp

O relatório de tendências de Mary Meeker saiu após 5 anos. Desta vez, o foco é AI. Total de 340 páginas
A velocidade de uso e disseminação da AI é muito mais rápida do que a da internet, e o momento em que as máquinas ultrapassam os humanos está chegando
Isso está sendo impulsionado pela infraestrutura global de internet (5,5 bilhões de usuários), por datasets digitais acumulados ao longo de mais de 30 anos e pelo surgimento de grandes modelos de linguagem (LLMs) liderados pelo ChatGPT, além de inovações em usabilidade e velocidade
As novas empresas de AI estão se movendo de forma muito agressiva em inovação, investimento, lançamento de produtos e captação de capital, enquanto as big techs estabelecidas também aceleram investimentos centrados em AI e crescimento
A competição em AI entre China e Estados Unidos, entre outras disputas por hegemonia tecnológica global, está se intensificando fortemente, e espera-se que este relatório contribua para a discussão sobre mudanças tecnológicas, financeiras, sociais, físicas e geopolíticas

Estrutura do documento

As mudanças estão acontecendo mais rápido do que no passado?
→ Sim, e na prática estão acelerando ainda mais
Crescimento de usuários de AI + uso + despesas de capital (CapEx) =
→ Crescimento sem precedentes (Unprecedented)
O custo de compute dos modelos de AI sobe, e o custo de inferência (Inference) cai =
→ Desempenho convergindo (Performance Converging), aumento do uso por desenvolvedores (Developer Usage)
Crescimento de uso (Usage) + custo (Cost) + perdas (Loss) de AI =
→ Em nível sem precedentes (Unprecedented)
A ameaça à monetização (Monetization) da AI =
→ Concorrência mais intensa, momentum do open source (expansão de força), ascensão da China
Fusão entre o mundo físico e a AI (Ramps) =
→ Rápida e orientada por dados (Fast + Data-Driven)
Crescimento de usuários globais de internet impulsionado por AI =
→ Um crescimento nunca antes experimentado
A evolução (Evolution) da AI e do trabalho (Work) =
→ No mundo real, avançando rapidamente (Real + Rapid)

Visão geral

Dizer que “o mundo está mudando em uma velocidade sem precedentes” já chega a ser um eufemismo, tamanha a expansão abrupta da velocidade e do alcance das mudanças
Inovação tecnológica, adoção acelerada e mudanças na liderança global formam a base (Underpinnings) de toda essa transformação

Missão de fundação do Google (1998): 'organizar as informações do mundo e torná-las universalmente acessíveis e úteis'
Missão de fundação do Alibaba (1999): 'facilitar fazer negócios em qualquer lugar'
Missão de fundação do Facebook (2004): 'dar às pessoas o poder de compartilhar mais e tornar o mundo mais aberto e conectado'

Hoje, a combinação de AI (Artificial Intelligence), poder computacional acelerado (Computing Power) e capital sem fronteiras (Borderless Capital) está impulsionando mudanças gigantescas ao melhorar drasticamente a organização, a conexão e a acessibilidade da informação

Assim como os recordes de atletas no esporte são continuamente melhorados com dados/insumos/treinamento, as empresas também se tornam cada vez mais inteligentes e competitivas à medida que computadores aprendem com datasets massivos
Inovações em grandes modelos (Large Models), queda no custo por token (cost-per-token), proliferação do open source (Open-Source Proliferation) e melhora no desempenho de chips (Chip Performance) elevam dramaticamente a economia, o poder e a acessibilidade da tecnologia

O ChatGPT da OpenAI é o caso de “sucesso da noite para o dia (overnight success)” mais rápido da história em métricas de usuários, uso e monetização (alcançado 9 anos após a fundação)
O uso de AI cresce de forma explosiva entre consumidores, desenvolvedores, empresas e governos
Na revolução da Internet 1.0, a tecnologia começou nos Estados Unidos e se espalhou gradualmente, mas o ChatGPT foi adotado simultaneamente no mundo todo e cresceu rapidamente

As grandes plataformas estabelecidas (incumbents) e os novos desafiantes (challengers) competem para dominar novas camadas da infraestrutura de AI, como interfaces agentic (agentic interfaces), copilots corporativos (enterprise copilots), sistemas autônomos do mundo real (real-world autonomous systems) e modelos soberanos (sovereign models)
O avanço radical de AI, infraestrutura de compute e conectividade global (global connectivity) está reconfigurando de forma fundamental, em empresas e países, a maneira de trabalhar (Work), a alocação de capital (Capital Deployment) e os próprios critérios de liderança

Ao mesmo tempo, mudanças na liderança global estão em curso, e as grandes potências estão ativamente contendo a competitividade e as vantagens comparativas umas das outras
Países ao redor do mundo estão acelerando novamente de acordo com suas ambições econômicas, sociais e territoriais (Economic / Societal / Territorial Aspiration)

Agora, duas grandes forças — tecnológica (Technological) e geopolítica (Geopolitical) — estão se entrelaçando cada vez mais profundamente
O CTO da Meta Platforms, Andrew Bosworth, comentou recentemente no podcast ‘Possible’ que “agora a AI parece uma corrida espacial (Space Race), e grandes países, especialmente a China, têm capacidades muito elevadas; quase não há segredos, e todos estão avançando de forma constante”

A liderança em AI (AI Leadership) pode levar diretamente à liderança geopolítica (Geopolitical Leadership) (o contrário não vale)
Esse fenômeno vem acompanhado de grande incerteza (Uncertainty), mas, como disse o ex-presidente da T. Rowe Price, Brian Rogers, “estatisticamente, o mundo não acaba com tanta frequência”, então uma visão otimista é importante

Do ponto de vista do investidor, sempre se assume que tudo pode dar errado, mas a expectativa sobre o que pode dar certo de verdade é a fonte da verdadeira esperança (Optimism)
Ver a AI fazendo trabalho no nosso lugar lembra a magia dos primórdios do e-mail e da busca na web, e os efeitos de melhor / mais rápido / mais barato (Better / Faster / Cheaper) estão se espalhando muito mais depressa
Claro, os riscos (Danger) e as incertezas também são grandes, mas existe a expectativa de que, no longo prazo, forte concorrência (Competition), inovação (Innovation), compute barato e acessível (Accessible Compute), tecnologia de AI se disseminando rapidamente e uma liderança cuidadosa e calculada (Thoughtful and Calculated Leadership) criem um equilíbrio semelhante à destruição mútua assegurada (Mutually Assured Deterrence)

Para alguns, a evolução da AI pode ser uma corrida para o fundo (Race to the Bottom), mas para outros é o começo de uma corrida ao topo (Race to the Top)
As forças especulativas e dinâmicas do capitalismo (Capitalism) e da destruição criativa (Creative Destruction) estão provocando uma enorme transformação tectônica
Em especial, a competição feroz entre os Estados Unidos (USA), a China (China) e os líderes globais de tecnologia já está em modo 'game on'

Este relatório busca mostrar de forma multidimensional as tendências deste momento dinâmico (Dynamic Time) com base em vários dados, pesquisas e benchmarks de terceiros
Em última instância, o objetivo deste relatório é contribuir para essa discussão

1. As mudanças estão acontecendo mais rápido do que no passado?

Technology Compounding = os números por trás do momentum

"Crescimento composto da tecnologia = os números e dados por trás do momentum do crescimento explosivo"

História dos ciclos de computação e a chegada da era da IA
- Anos 1960: mainframe (Mainframe, ~1 milhão de unidades) → minicomputador (Minicomputer, ~10 milhões de unidades) → PC (~300 milhões de unidades) → internet desktop (Desktop Internet, ~1 bilhão de usuários) → internet móvel (Mobile Internet, ~4 bilhões) → era da IA (AI Era, dezenas de bilhões)
- A infraestrutura de computação acumulada (CPU, GPU, nuvem/big data) se tornou a base para a disseminação da IA
- Na era dos dispositivos de IA, espera-se um número de dispositivos de dezenas de milhares a centenas de milhares de vezes maior do que na era dos mainframes
Crescimento dos datasets de treinamento de modelos de IA (número de palavras)
- De 1950 a 2025, o tamanho dos datasets de treinamento (em número de palavras) dos principais modelos de IA cresceu 260% ao ano, em média
- Desde 2018, com o surgimento de grandes modelos como GPT-2, GPT-3 e GNMT, o volume de dados utilizados cresceu exponencialmente
- Modelos recentes, como o Aramco Metabrain AI, estão sendo treinados com dezenas de trilhões de palavras
Crescimento do compute usado no treinamento de modelos de IA (volume de cálculo, FLOP)
- De 1950 a 2025, o volume de computação usado no treinamento dos principais modelos de IA cresceu 360% ao ano, em média
- Com o surgimento de grandes modelos como GPT-4, Grok, AlphaGo e Swift, o indicador de FLOP disparou
Ganho de eficiência de compute trazido pela inovação em algoritmos
- De 2014 a 2023, o Effective Compute dos modelos de IA aumentou 200% ao ano, em média
- Otimizações algorítmicas como Chinchilla e OPT-175B contribuíram fortemente para melhorar o desempenho e reduzir o consumo de compute
Crescimento de desempenho dos supercomputadores de IA
- De 2019 a 2025, o desempenho dos supercomputadores de IA (clusters) cresceu 150% ao ano, em média
- Sunway OceanLight, clusters do GPT-3/4, Frontier, El Capitan, xAI Colossus etc.
- Crescimento simultâneo do desempenho dos chips e do número de chips por cluster
Explosão no número de modelos de IA poderosos em larga escala
- De 2017 a 2024, crescimento anual de 167%: disparou o número de lançamentos de grandes modelos de IA com mais de 10^23 FLOP
- DeepMind (AlphaGo), xAI, Anthropic, Meta, NVIDIA, Mistral e outros players passaram a surgir em sequência
Crescimento de usuários, assinantes e receita do ChatGPT
- Entre 10/2022 e 4/2025, usuários ativos semanais (Users, MM), assinantes (Subscriber, MM) e receita (Revenue, $B) cresceram exponencialmente
- Mais de 800 milhões de usuários semanais, mais de 20 milhões de assinantes e receita anual se aproximando de US$ 4 bilhões
Velocidade para atingir 365 bilhões de buscas anuais: ChatGPT vs Google
- ChatGPT: atingiu 365 bilhões de buscas anuais em 2 anos (2024)
- Google: levou 11 anos para chegar ao mesmo número (2009)
- O ChatGPT registrou uma velocidade de disseminação 5,5 vezes maior que a do Google

Em 1998, quando a popularização da internet estava começando, o Google surgiu com a meta de "organizar as informações do mundo e torná-las universalmente acessíveis e úteis"
Após quase 30 anos, no período de transformação mais veloz já vivido pela humanidade, hoje a maior parte das informações já está digitalizada, acessível e utilizável
A mudança na forma de acessar e mover informação com base em IA está acontecendo em ritmo muito mais rápido

A IA é um Compounder (algo que cresce de forma composta) sobre a infraestrutura da internet e,
ao permitir que qualquer pessoa use com facilidade serviços que despertam interesse de massa, cria um fenômeno de disseminação extremamente rápida

Evolução da distribuição de conhecimento (Knowledge Distribution Evolution)

1440~1992: Static + Physical Delivery
- Da invenção da prensa tipográfica (Printing Press) em 1440 até 1992, o conhecimento foi distribuído de forma estática (Static) e física (Physical)
- Ou seja, a estrutura de transmissão de conhecimento centrada em impressos, como livros, jornais e revistas, foi mantida por centenas de anos
  – 1993~2021: Active + Digital Delivery
- Após a publicação da internet (World Wide Web) em 1993, houve a transição para uma distribuição de conhecimento ativa (Active) e baseada no digital (Digital)
- Qualquer pessoa passou a poder criar um site e acessar/distribuir informação em tempo real
- A internet provocou uma transformação fundamental na “abertura e circulação do conhecimento”
  – 2022+: Active + Digital + Generative Delivery
- Com o lançamento do ChatGPT em 2022, entramos na era da distribuição de conhecimento baseada em IA generativa
  - Generative AI: IA capaz de gerar diferentes tipos de conteúdo, como texto, imagem, áudio e código
  - O ChatGPT bateu o recorde histórico de crescimento ao superar 1 milhão de usuários em 5 dias após o lançamento
- Agora, o conhecimento não é apenas armazenado e buscado: estamos na era em que a IA o gera criativamente e o entrega de imediato

“Conhecimento é o acúmulo de fatos (wisdom), mas sabedoria está na sua simplificação” – Martin H. Fischer

AI = Many Years Before Lift-Off
- A tecnologia de IA pode parecer ter crescido de forma explosiva em pouco tempo, mas houve décadas de preparação e evolução antes da popularização em larga escala
Timeline de marcos da IA de 1950 a 2025 (organizada por Stanford)
- 10/1950: Alan Turing publica o teste de Turing (proposta do conceito de avaliação da inteligência de computadores)
- 6/1956: realização da Dartmouth Conference; John McCarthy cria o termo ‘Artificial Intelligence’
- 1/1962: Arthur Samuel, da IBM, derrota o campeão dos EUA no jogo de damas com um programa de autoaprendizado
- 1/1966: Shakey, de Stanford, é implantado como o primeiro robô móvel de uso geral
- 1967~1996: “inverno da IA” (AI Winter) – queda no investimento/interesse sem grandes avanços
- 5/1997: IBM Deep Blue derrota o campeão mundial de xadrez Kasparov
- 9/2002: Roomba, primeiro robô aspirador produzido em massa, é lançado
- 10/2005: o carro autônomo Stanley, de Stanford, completa o DARPA Grand Challenge
- 4/2010: Apple adquire a Siri e a integra ao iPhone 4S
- 6/2014: o chatbot Eugene Goostman passa no teste de Turing
- 6/2018: OpenAI apresenta o GPT-1, o primeiro grande modelo de linguagem
- 6/2020: OpenAI lança o GPT-3 e a Microsoft obtém licença exclusiva
- 11/2022: OpenAI libera o ChatGPT ao público em geral
- 3/2023: OpenAI lança o GPT-4 (multimodal) / Microsoft integra o Copilot / Google lança o Bard / Anthropic lança o Claude
- 11/2023: 28 países, incluindo EUA, UE e China, assinam a Declaração de Segurança em IA de Bletchley
- 3~5/2024: Meta revela o Llama 3 (open source) / Departamento de Segurança Interna dos EUA divulga roadmap de IA / Google introduz busca baseada em IA / OpenAI lança o GPT-4o (totalmente multimodal)
- 7/2024: Apple anuncia o Apple Intelligence (para desenvolvedores)
- 9/2024: Alibaba lança 100 modelos open source Qwen 2.5 (com desempenho equivalente ao do Ocidente)
- 12/2024: OpenAI anuncia o o3 (modelo de melhor desempenho)
- 1/2025: DeepSeek revela os modelos open source de raciocínio R1 e R1-Zero / Alibaba anuncia o Qwen2.5-Max (superando GPT-4o e Claude 3.5 em desempenho de raciocínio)
- 2/2025: OpenAI lança o GPT-4.5 / Anthropic anuncia o Claude 3.7 Sonnet / xAI lança o Grok 3
- 4/2025: ChatGPT chega a 800 milhões de usuários semanais

Por volta do 2º tri/25 - 10 coisas que a IA consegue fazer hoje (segundo o ChatGPT)

Escrever ou editar qualquer coisa: redigir e editar instantaneamente e com fluidez e-mails, redações, contratos, poemas, código etc.
Resumir e explicar materiais complexos: interpretar facilmente PDFs, documentos jurídicos, pesquisas e código, convertendo-os em inglês claro e comum
Atuar como tutor em quase qualquer tema: suporte ao aprendizado passo a passo em matemática, história, idiomas, preparação para provas etc.
Servir como parceiro de reflexão: apoio ao pensamento com brainstorming de ideias, depuração lógica, verificação de hipóteses etc.
Automatizar tarefas repetitivas: geração de relatórios, organização de dados, resumo de slides, reescrita de textos etc.
Interpretar o papel necessário: desempenhar diferentes papéis, como preparação para entrevistas, simulação de clientes e ensaio de conversas
Conectar ferramentas: escrever código de integração com várias ferramentas, como API, planilhas, calendário e código web
Oferecer apoio psicológico e companhia: conversar sobre o dia, reorganizar pensamentos ou simplesmente ouvir
Ajudar a encontrar propósito de vida: clarificação de valores, definição de metas, elaboração de planos de ação etc.
Organizar a vida: planejamento de viagens, criação de rotinas, estruturação da semana ou do fluxo de trabalho etc.

Por volta de 2030? - 10 coisas que se espera que a IA possa fazer nos próximos 5 anos (segundo o ChatGPT)

Gerar texto, código e lógica em nível humano: produzir resultados comparáveis aos humanos em chatbots, engenharia de software, planos de negócios, análise jurídica etc.
Criar filmes e jogos completos: produção automática de conteúdo completo, incluindo roteiro, personagens, cenas, mecânicas de jogabilidade e dublagem
Compreender e falar como humanos: assistentes com reconhecimento emocional, agentes de voz multilíngues em tempo real etc.
Atuar como assistente pessoal avançado: planejamento de vida, recuperação de memórias, integração de agenda e informações entre todos os apps e dispositivos etc.
Operar robôs humanoides: ajuda doméstica, cuidado de idosos, automação de varejo e hospitalidade etc.
Operar atendimento ao cliente e vendas de forma autônoma: resolução de problemas end-to-end, upselling, integração com CRM, suporte 24/7 etc.
Personalizar toda a vida digital do indivíduo: aprendizado adaptativo, recomendação dinâmica de conteúdo, gestão de saúde personalizada etc.
Construir e operar negócios autonomamente: startups baseadas em IA, otimização de estoque e preços, operação digital integral etc.
Automatizar descobertas científicas: design de fármacos, síntese de novos materiais, modelagem climática, teste de novas hipóteses etc.
Colaborar criativamente como parceiro: coautoria de romances, produção musical, design de moda, arquitetura e outras colaborações criativas

Por volta de 2035? - 10 coisas que se espera que a IA possa fazer nos próximos 10 anos (segundo o ChatGPT)

Realizar pesquisa científica: geração de hipóteses, execução de simulações, desenho e análise de experimentos etc.
Projetar tecnologias avançadas: descoberta de novos materiais, design em biotecnologia, criação de protótipos de sistemas de energia etc.
Simular mentes semelhantes às humanas: criação de personas digitais com memória, emoções e comportamento adaptativo
Operar empresas de forma autônoma: gerenciar P&D, finanças e logística com intervenção humana mínima
Executar tarefas físicas complexas: manipulação de ferramentas, montagem de peças, adaptação em ambientes reais etc.
Orquestrar sistemas globais: otimizar logística, uso de energia e resposta a crises em larga escala
Modelar sistemas biológicos: simulação de células, genes e organismos e aplicação em tratamento/pesquisa
Fornecer tomada de decisão em nível especialista: oferecer aconselhamento jurídico, médico e empresarial em tempo real
Participar de debate público e formulação de políticas: mediação de fóruns, proposta de projetos de lei, coordenação de interesses etc.
Construir mundos virtuais imersivos: gerar ambientes 3D interativos apenas com prompts de texto

A velocidade do desenvolvimento de IA está em um nível que ninguém previa

Mudança dos protagonistas do desenvolvimento de modelos de machine learning (2003~2024)
- De 2003 a 2014, a academia (academia) liderou o desenvolvimento de modelos de machine learning (Era da Academia)
- Desde 2015, a indústria (industry) superou amplamente a academia em dados, capacidade computacional e capital investido, liderando a inovação (Era da Indústria)
- Em 2024, cerca de 60 modelos de ML dignos de destaque são desenvolvidos por ano na indústria
Crescimento explosivo do número de desenvolvedores de IA (com base no ecossistema NVIDIA, 2005~2025)
- No ecossistema NVIDIA, o número global de desenvolvedores aumentou 6 vezes em 7 anos (com projeção de alcançar 6 milhões em 2025)
- O maior crescimento ocorreu entre 2018 e 2025
Número de desenvolvedores no ecossistema de IA do Google (2024~2025)
- Maio de 2024: 1,4 milhão → maio de 2025: 7 milhões
- Crescimento de 5 vezes em apenas 1 ano, com expansão explosiva da comunidade de desenvolvedores de IA centrada na plataforma Gemini
Aumento explosivo das patentes americanas relacionadas à computação (1960~2024)
- Nos 8 anos após o IPO da Netscape em 2003: +6.300 casos; nos 18 anos de 2004 a 2022: aumento de +1.000 casos
- Após o lançamento do ChatGPT (2022), houve um salto de +6.000 em apenas 1 ano
- Patentes de inovação relacionadas a computação/IA estão sendo despejadas em larga escala
Desempenho da IA supera o nível humano em 2024
- No benchmark MMLU (conhecimento geral + raciocínio), em 2024 os sistemas de IA alcançaram 92,3% de precisão, superando os humanos (89,8%)
Capacidade da IA de se passar por humana (1º tri de 2025)
- GPT-4o (sem persona): 73% das respostas foram confundidas com respostas humanas
- GPT-4.5 (com persona): falha em identificar que era IA em mais de 90% dos casos
- A semelhança e o realismo das respostas de IA melhoraram drasticamente
Realismo das conversas com IA (caso do teste de Turing)
- Exemplo real de conversa em teste de Turing usando GPT-4.5
- 87% dos participantes do experimento confundiram com humano o lado (A), que na verdade era uma IA,
  enquanto o humano (B) foi julgado como tendo uma “atmosfera de IA”
- A capacidade de conversa natural da IA moderna superou a dos humanos
Evolução do desempenho de geração de imagens por IA
- Comparação entre Midjourney v1 (2022) e v7 (2025):
  em 3 anos, o resultado da geração de joias (colar de girassol) evoluiu para um realismo esmagador
Imagens geradas por IA vs imagens reais (2024)
- Em 2024, fotos de pessoas geradas por IA (StyleGAN2) tornaram-se tão sofisticadas que quase não se distinguem de fotos reais
- O realismo das imagens geradas aumentou drasticamente
Realismo da geração/tradução de voz por IA (caso ElevenLabs)
- A ferramenta de geração de voz por IA da ElevenLabs
  - avançou em dublagem automática, tradução multilíngue em tempo real, preservação da voz original etc.
  - o tráfego global do site ultrapassou 20 milhões de visitas mensais em 2 anos, e 60% das empresas da Fortune 500 adotaram a solução
- A geração e tradução de áudio por IA também estão avançando de forma explosiva
Popularização da tradução de áudio com IA (Spotify, maio de 2025)
- O Spotify começou a aceitar traduções por IA de audiolivros em 29 idiomas em parceria com a ElevenLabs
- Apresentou como visão “uma era em que qualquer pessoa cria conteúdo em seu idioma nativo, e a IA o traduz em tempo real e o entrega ao mundo todo” (CEO Daniel Ek)
- No 1º trimestre de 2025, 678 milhões de usuários ativos mensais, 268 milhões de assinantes e receita anual de 16,8 bilhões de euros
Aceleração do desempenho da IA: novos casos de uso (novembro de 2024, Morgan Stanley)
- Dobramento de proteínas (Protein Folding): DeepMind AlphaFold, previsão de quase todas as estruturas de proteínas
- Detecção de câncer (Cancer Detection): Microsoft & Paige, construção do maior modelo de detecção de câncer baseado em imagens do mundo
- Robótica (Robotics): Google, demonstração de robô que entende e executa instruções humanas usando LLM
- IA agêntica (Agentic AI): Amazon, divulgação de ferramenta que executa tarefas conforme instruções do usuário
- Tradução universal (Universal Translation): Meta, lançamento de modelo multimodal de interpretação e tradução multilíngue
- Criação de vídeo digital (Digital Video Creation): Channel 1 AI, demonstração de produção de vídeo de notícias personalizado com base em GenAI

Benefícios e riscos da IA (Benefits & Risks)

Benefícios do desenvolvimento de IA
- Todas as conquistas da civilização humana são fruto da inteligência humana, e quanto maior o nível de inteligência de máquina (machine intelligence), mais as ambições da humanidade também se expandem
- IA e robôs podem libertar a humanidade do trabalho repetitivo e, com o aumento da produtividade, abrir uma era de paz e prosperidade
- A aceleração da pesquisa científica pode antecipar a solução de doenças, mudanças climáticas e problemas de recursos
Riscos do desenvolvimento de IA
- Demis Hassabis (Google DeepMind): "Se resolvermos a IA primeiro, poderemos resolver todo o resto. Mas, antes de termos essa oportunidade, podem surgir uso indevido, abuso e riscos não intencionais da IA"
- Riscos já evidentes e que tendem a crescer ainda mais: armas autônomas letais (lethal autonomous weapons), vigilância (surveillance), tomada de decisão enviesada (biased decision making), impacto no emprego (employment impact), segurança e proteção (safety-critical applications, cybersecurity) etc.

"O sucesso no desenvolvimento da IA pode ser o maior acontecimento da história da civilização humana, mas também pode ser o último, se não aprendermos a evitar seus riscos" - Stephen Hawking

Crescimento de Usuários + Uso + CapEx de IA = Sem Precedentes

Tomando o ChatGPT como referência, em apenas 17 meses ele ultrapassou 800 milhões de usuários ativos semanais (+8x)
A velocidade da adoção global de IA (Global Adoption), em comparação com os primeiros anos da internet, também mostra uma expansão sem precedentes (atingiu 90% de usuários fora da América do Norte em 3 anos; a internet levou 23 anos)
Até alcançar 100 milhões de usuários, o ChatGPT levou 0,2 ano (cerca de 2 meses), um crescimento muito mais rápido que grandes serviços de internet como TikTok, Instagram e YouTube
Até alcançar 1 milhão de usuários (clientes): Ford Model T, 2.500 dias; iPhone, 74 dias; ChatGPT, 5 dias — com custo de acesso de US$ 0, no auge da acessibilidade
Nos EUA, estima-se que a IA levará 3 anos para chegar a 50% dos lares, contra internet móvel (6 anos), desktop (12 anos), PC (20 anos) e Revolução Industrial (42 anos), ou seja, metade do tempo
A velocidade de adoção e difusão da IA é mais rápida do que a de qualquer tecnologia na história, e seu alcance e escala de impacto também superam as expectativas

Adoção de IA por empresas de tecnologia é prioridade máxima

Big techs e grandes empresas de tecnologia estão concentrando esforços em IA como tema central de gestão
- NVIDIA, Google, Microsoft, Meta, Amazon, Baidu, IBM, C3.ai etc.
- Entre 2020 e 2024, a frequência de menções a IA em transcrições de resultados disparou, marcando o início de uma competição centrada em IA
Amazon (CEO Andy Jassy)
- "A IA generativa vai revolucionar praticamente todas as experiências dos clientes"
- Adoção e ganho de eficiência com IA em todas as áreas, como programação, busca, compras, finanças, saúde, robótica e biotecnologia
Google (CEO Sundar Pichai)
- "A IA é o meio mais importante para avançar nossa missão de organizar a informação e torná-la universalmente acessível"
- "A oportunidade da IA está em outra dimensão em relação a tudo o que vimos até agora"
Duolingo (CEO Luis von Ahn)
- "A IA generativa contribui para geração de dados, novos recursos e eficiência em toda a empresa"
- Até o currículo de xadrez foi prototipado inteiramente com IA
xAI (CEO Elon Musk)
- "No Grok AI, a busca pela verdade (truth-seeking) é a essência e algo indispensável para a segurança da IA"
- "Precisamos criar uma IA o mais orientada à verdade possível"
Roblox (CEO David Baszucki)
- "A IA é uma ferramenta de aceleração que maximiza a capacidade individual; no futuro, todos terão sua própria IA"
NVIDIA (CEO Jensen Huang)
- "Dentro de 10 anos, a IA será a infraestrutura de todas as indústrias, todos os países e todas as empresas"
- "Um datacenter de IA é, em essência, uma 'AI factory', que produz um valor enorme"
Líderes globais de tecnologia estão apostando tudo na adoção de IA e na expansão de infraestrutura, enfatizando em uníssono que a IA é o núcleo da competitividade futura de empresas e sociedades

A adoção de IA por empresas tradicionais também sobe rapidamente na lista de prioridades

Forte alta no interesse por IA entre empresas do S&P 500
- No 4º trimestre de 2024, 50% das empresas do S&P 500 mencionaram 'IA' em apresentações de resultados (forte aumento em relação a 2015)
- Em todo o ambiente corporativo, a IA emergiu como agenda estratégica central
Para grandes empresas globais, o objetivo da adoção de IA é 'crescimento de receita'
- Nos próximos 2 anos, a maioria dos objetivos de investimento em IA generativa (GenAI) estará focada em 'crescimento e rentabilidade', como produtividade, atendimento ao cliente, receita e eficácia de marketing
- Redução de custos (cost reduction) é prioridade relativamente menor
75% dos CMOs globais (diretores de marketing) estão testando/adotando ferramentas de IA
- A maior parte das organizações de marketing está conduzindo testes iniciais ou pilotos, e uma parcela significativa já adotou IA plenamente
Casos reais de adoção
- Bank of America: Erica Virtual Assistant
  - 40 milhões de clientes, 2,5 bilhões de interações acumuladas, mais de 50.000 atualizações de desempenho
  - Consolidou-se como assistente financeiro digital 24/7
- JP Morgan: modernização de IA de ponta a ponta
  - Com a adoção de IA/ML, espera-se entre 2023 e 2025 um ganho de +35~65% tanto em receita quanto em eficiência
- Kaiser Permanente: prontuário médico com IA (AI Scribe)
  - Adotado por milhares de profissionais de saúde, reduz a carga de documentação e melhora a experiência do paciente e a qualidade do atendimento
- Yum! Brands: Byte by Yum!
  - Em 2025, sistemas de pedidos e operação com IA foram adotados em 25.000 restaurantes
Mesmo grandes empresas tradicionais estão tratando a adoção de IA não como 'redução de custos', mas como prioridade estratégica centrada em crescimento e inovação
- Em cada setor, casos concretos de sucesso no uso de IA estão se acumulando rapidamente

A adoção de IA em educação, governo e pesquisa também sobe rapidamente na lista de prioridades

Casos de integração de IA no setor de educação (instituições educacionais)
- Arizona State University: criação de uma organização dedicada ao desenvolvimento de ferramentas de IA ('AI Acceleration')
- Parceria Oxford-OpenAI: cooperação de 5 anos para fortalecer pesquisa e alfabetização em IA
- NextGenAI: lançamento de um consórcio de US$ 50 milhões com participação de 15 universidades de pesquisa, incluindo MIT, Harvard e Caltech
- ChatGPT Gov: lançamento do ChatGPT para uso exclusivo de órgãos do governo federal dos EUA (janeiro de 2025)
- Laboratórios nacionais dos EUA: cooperação em infraestrutura de IA para energia nuclear, cibersegurança e ciência avançada
Expansão das políticas de adoção governamental (Sovereign AI)
- NVIDIA Sovereign AI Partners: aceleração da construção de infraestrutura nacional de IA em países como França, Suíça, Espanha, Equador, Japão, Vietnã e Singapura
- "Ver países investindo em infraestrutura de IA é semelhante ao que aconteceu no passado com eletricidade e infraestrutura de internet" (CEO da NVIDIA, Jensen Huang)
Ampliação da aplicação de IA em pesquisa (R&D) e saúde
- Dispositivos médicos com IA aprovados pela FDA: 223 aprovações anuais em 2023, crescimento explosivo em relação a 2015 (orçamento de IA do governo federal dos EUA no FY21~FY25: US$ 14,7 bilhões)
- Descoberta de fármacos com IA: tempo para chegar à fase pré-clínica (Pre-Clinical) reduzido em 30~80% em relação aos métodos tradicionais (aceleração de 1,5~12x)
Mesmo em setores sem fins lucrativos/públicos, como educação, governo, pesquisa e saúde, a adoção e integração de IA estão se expandindo rapidamente
- Com investimento em infraestrutura, flexibilização regulatória e pesquisa conjunta, a velocidade da inovação em IA fora da indústria também está acelerando

Usuários de IA + Uso + Crescimento de CapEx = Sem Precedentes

Situação do uso do ChatGPT entre adultos nos EUA
- A proporção de adultos americanos que já usaram o ChatGPT disparou de 18% em julho de 2023 para 37% em janeiro de 2025
- Entre 18 e 29 anos, o índice é de 55%, e entre 30 e 49 anos, de 44%, mostrando maior uso entre os mais jovens
- O CEO da OpenAI, Sam Altman, avaliou que “os mais jovens usam como orientador de vida, enquanto os mais velhos usam como substituto da busca”
Aumento do tempo médio diário de uso do app do ChatGPT
- De julho de 2023 a abril de 2025, entre usuários do app do ChatGPT nos EUA, o tempo médio diário de uso aumentou 202%
- Passou de cerca de 7 minutos por dia para quase 20 minutos, indicando um salto no engajamento dos usuários com apps de IA
Aumento das sessões e do tempo por sessão no app do ChatGPT
- De julho de 2023 a abril de 2025, o número médio de sessões cresceu 106%, e o tempo por sessão aumentou 47%
- Os usuários passaram a usar o app com mais frequência e por mais tempo, consolidando as ferramentas de IA no cotidiano
Comparação da retenção semanal de usuários entre ChatGPT e Google Search
- De janeiro de 2023 a abril de 2025, a retenção semanal do ChatGPT foi de 80%, superando com folga os 58% do Google Search
- A fidelidade dos usuários a serviços de IA aparece mais alta do que na busca tradicional
Efeitos do uso de chatbots de IA no trabalho nos EUA
- Mais de 72% dos trabalhadores americanos que usam chatbots de IA relataram desempenho “mais rápido e melhor” no trabalho
- Foram relatadas mudanças positivas tanto em eficiência quanto na qualidade do trabalho
Casos de uso do ChatGPT entre universitários nos EUA
- Entre universitários americanos (18 a 24 anos), os usos do ChatGPT se concentram em iniciar trabalhos/projetos, resumir textos, brainstorming de ideias, resolução de problemas, preparação para provas, pesquisa e tutoria, com foco em estudo, pesquisa e orientação de carreira
- A IA vem sendo usada ativamente para resolver tarefas práticas, trabalhos criativos e até planejamento de carreira
Serviços de automação de pesquisa profunda baseados em IA
- Expansão dos recursos de deep research de grandes empresas como Google Gemini, OpenAI ChatGPT e xAI Grok
- A automação de tarefas avançadas de trabalho intelectual está se acelerando, com pesquisa automatizada na web, geração de insights, criação automática de relatórios de dezenas de páginas e apuração de fatos

Evolução dos agentes de IA = das respostas em chat para a automação real do trabalho

Enquanto os chatbots tradicionais ficavam limitados a conversas restritas e respostas simples, os agentes de IA estão evoluindo para prestadores de serviço capazes de processar por conta própria raciocínio, execução e tarefas em múltiplas etapas
- Exemplos: agendamento de reuniões, envio de relatórios, login em ferramentas e automação de fluxos de trabalho entre várias plataformas
- Comandos em linguagem natural já bastam para executar diretamente tarefas complexas
Essa mudança é semelhante à transição, no início dos anos 2000, de sites estáticos para web apps dinâmicos como Gmail e Google Maps
- A evolução vai de uma interface simples de mensagens para uma infraestrutura que executa trabalho real
Diferentemente dos assistentes iniciais, que forneciam apenas entradas claras ou resultados limitados, os agentes de IA agora contam com foco em objetivos, autonomia e salvaguardas, tornando possível executar processos complexos como interpretação de intenção, gerenciamento de memória e colaboração entre apps
As empresas lideram a adoção em ritmo mais rápido e já avançam além da simples experimentação, intensificando investimentos em frameworks e na construção de ecossistemas de agentes

Crescimento explosivo do interesse global por AI Agent (tendências de busca no Google, 2024~2025)
- O volume de buscas no Google pela palavra-chave “AI Agent” disparou 1.088% em 16 meses
- Em março de 2025, após a OpenAI lançar ferramentas de desenvolvimento para AI Agent, o volume de buscas acelerou ainda mais, sugerindo um ponto de virada técnico para o setor

Aceleração dos lançamentos de produtos de AI Agent por incumbentes de IA (2024~2025)
- Grandes empresas de tecnologia como Salesforce, Anthropic, OpenAI e Amazon vêm lançando em sequência novos produtos baseados em agentes de IA
  - Salesforce Agentforce: automação de atendimento ao cliente, prospecção de leads, rastreamento de pedidos etc.
  - Anthropic Claude 3.5 Computer Use: controle direto da tela do computador, extração de dados da web, compras online etc.
  - OpenAI Operator: automação de tarefas online complexas
  - Amazon Nova Act: automação residencial, coleta de informações, compras, gestão de agenda etc.
- Os produtos de AI Agent estão indo além dos chatbots tradicionais e se expandindo como ferramentas práticas de automação que de fato substituem trabalho

Próxima fronteira da IA = Artificial General Intelligence

O que é Artificial General Intelligence (AGI)?
- AGI se refere a um sistema capaz de executar todo o conjunto de tarefas intelectuais humanas, incluindo raciocínio, planejamento, aprendizado com pequenos volumes de dados e generalização de conhecimento entre diferentes áreas
- Diferentemente dos modelos atuais de IA, que mostram desempenho excelente em domínios específicos, a AGI poderá resolver com flexibilidade novos problemas em qualquer área, sem necessidade de reentreinamento
- O recente crescimento exponencial em escala de modelos, dados de treinamento e eficiência computacional está acelerando o desenvolvimento da AGI
Prazo para alcançar a AGI e expectativas
- O momento em que a AGI será alcançada ainda é incerto, mas as expectativas dos especialistas avançaram significativamente nos últimos anos
- Em janeiro de 2025, o CEO da OpenAI, Sam Altman, afirmou: “agora estamos confiantes de que sabemos como construir a AGI no sentido em que a entendíamos tradicionalmente”
- Isso sugere que os avanços em arquitetura de modelos, eficiência de inferência e ambientes de treinamento em larga escala estão reduzindo a distância entre pesquisa e aplicação prática
  - Inferência é o processo pelo qual um modelo já treinado gera previsões, respostas ou conteúdo a partir da entrada do usuário. Essa etapa é muito mais rápida e eficiente do que o treinamento
- A AGI começa a ser vista não mais como um ponto final hipotético, mas como um limiar alcançável
O significado de alcançar a AGI
- Com a realização da AGI, os papéis fundamentais de software e hardware serão redefinidos
- Em vez de repetir tarefas pré-programadas, os sistemas passarão a entender objetivos, formular planos e se autocorrigir em tempo real
- Fluxos de trabalho em pesquisa, engenharia, educação e logística poderão operar sem supervisão humana
- Mesmo diante de novos problemas, os sistemas serão capazes de se adaptar ao contexto sem reentreinamento, operando como especialistas humanos
- Robôs humanoides baseados em AGI podem transformar de forma radical o ambiente físico e a maneira como trabalhamos
Impacto social que a AGI pode trazer
- A AGI não é o ponto final, mas uma transição gradual de capacidades
- Instituições, trabalho e estruturas de decisão serão reorganizados conforme a forma de adoção da AGI e os mecanismos de controle implementados
- O efeito sobre a produtividade pode ser enorme, mas os benefícios também podem ser distribuídos de forma desigual
- As mudanças geopolíticas, éticas e econômicas tendem a ocorrer gradualmente
- Assim como na Revolução Industrial, na transformação digital e na revolução algorítmica, os resultados dependerão não apenas do que a tecnologia pode fazer, mas de como a sociedade a aceita e a regula

AI User + Usage + CapEx Growth = sem precedentes

Nos últimos 20 anos, o CapEx no setor de tecnologia cresceu rapidamente seguindo um arco centrado em dados
- No início, os investimentos se concentraram em armazenamento e acesso; depois em distribuição e escalabilidade; e agora o foco está em computação e inteligência
Na primeira onda, os recursos foram direcionados para grandes fazendas de servidores, cabos submarinos e data centers iniciais, estabelecendo a base da computação em nuvem para empresas como Amazon, Microsoft e Google
- Nessa etapa, o objetivo central era “armazenar, organizar e fornecer como serviço”
A segunda onda, ainda em curso, está centrada no fortalecimento da infraestrutura computacional para cargas de trabalho de IA
- O CapEx dos hyperscalers está migrando para infraestrutura especializada como GPUs, TPUs, aceleradores de IA, resfriamento líquido e projetos avançados de data centers
- Em 2019, a IA era uma função de pesquisa, mas em 2023 passou a integrar os itens centrais de CapEx (despesa de capital)
Brad Smith, presidente da Microsoft (blog de 25/4):
- “Assim como a eletricidade foi uma tecnologia de propósito geral, a IA e os data centers em nuvem representam a próxima fase da industrialização”
As big techs globais estão realizando investimentos anuais na casa de dezenas de trilhões de won
- Mais do que simplesmente coletar dados, a capacidade de aprender rapidamente, personalizar profundamente e distribuir em larga escala está se tornando o núcleo da competitividade

Os gastos de CapEx (investimento em infraestrutura) de grandes empresas de tecnologia como AWS, NVIDIA, MSFT, Google, Apple e Meta vêm subindo de forma consistente há anos

Data Centers = principais beneficiários do gasto de CapEx em IA

Para entender a viabilidade econômica da infraestrutura de IA, é necessário observar a velocidade e a escala de construção de data centers
- Com a explosão da demanda centrada em IA, o CapEx (despesas de capital) de data centers das empresas globais de TI atingiu um recorde histórico e continua acelerando, chegando a US$ 455 bilhões em 2024
Tanto hyperscalers quanto empresas AI-first estão investindo bilhões de dólares na construção de infraestrutura de hardware de alto desempenho e alto consumo de energia, não apenas para armazenamento, mas também para inferência em tempo real e treinamento de modelos em larga escala
- À medida que a IA deixa de ser uma tecnologia experimental e passa a ser infraestrutura essencial, os data centers também passam a ocupar uma posição central nesse processo
- O CEO da NVIDIA, Jensen Huang, enfatizou que “agora os data centers de IA são fábricas de IA”
O data center xAI Colossus, em Memphis, Tennessee, nos EUA, concluiu um complexo equivalente a 418 casas em apenas 122 dias, alcançando velocidade e eficiência sem precedentes (menos da metade do tempo médio de construção de uma casa nos EUA)
- Com módulos pré-fabricados, licenciamento acelerado e integração vertical de eletricidade/mecânica/software, chega a era em que data centers são construídos na velocidade do desenvolvimento de produtos de TI
O CapEx de data centers é determinado por terreno, energia, chips e sistemas de refrigeração, e as cargas de trabalho de IA geram demandas de calor e energia muito maiores do que a computação corporativa tradicional
- O OpEx (despesas operacionais) se concentra em custos de energia e manutenção dos sistemas, especialmente porque clusters densos de treinamento de IA operam sob carga máxima de forma contínua
A receita vem da venda de compute (APIs de IA, cobrança de plataformas corporativas, ganhos internos de produtividade etc.), mas as empresas que constroem infraestrutura de forma antecipada podem enfrentar prazos mais longos para recuperar o investimento
- Startups podem levar de alguns trimestres a vários anos entre a construção da infraestrutura e a monetização
Do ponto de vista da cadeia de suprimentos, a garantia de infraestrutura elétrica (transformadores, subestações, turbinas, GPUs, cabos etc.) está surgindo como um novo gargalo
- Os data centers não são apenas ativos físicos, mas atuam como hubs estratégicos de infraestrutura para imobiliário, energia, logística, compute e monetização de software
As empresas que resolverem corretamente esse quebra-cabeça complexo vão definir a geografia futura da economia da IA

Data Centers = devoradores de eletricidade

A tensão entre IA e infraestrutura energética está se intensificando gradualmente
- Com o avanço da IA, data centers especializados em IA estão registrando consumo de eletricidade comparável ao da indústria pesada tradicional
- O principal motivo para a explosão da demanda elétrica é a enorme capacidade computacional necessária para treinar e operar modelos de IA
Em 2024, os data centers responderam por cerca de 1,5% do consumo global de eletricidade
- Desde 2017, o consumo global de eletricidade dos data centers cresceu em média 12% ao ano
- Isso equivale a mais de quatro vezes a velocidade de crescimento do consumo total de eletricidade
Na participação por país no consumo de eletricidade, os EUA lideram com 45%, seguidos por China (25%) e Europa (15%)
- Quase metade da capacidade de data centers dos EUA está concentrada em cinco grandes clusters regionais
- Mercados emergentes e países em desenvolvimento (excluindo a China) respondem por 50% dos usuários de internet, mas têm menos de 10% da capacidade de data centers
Com a disseminação da IA, a rede elétrica (grid) e a infraestrutura de fornecimento estão emergindo como gargalos para o desempenho da IA
- Já não são mais os dados ou os algoritmos, mas sim o fornecimento de energia que está se tornando a principal restrição ao crescimento da IA
Ao mesmo tempo, a IA está acelerando a eficiência operacional e a inovação dentro do setor de energia
- A otimização baseada em IA já está sendo aplicada de forma efetiva em toda a cadeia de suprimentos de energia, incluindo geração, minerais, transmissão e consumo
- Mas, enquanto a demanda de IA e os custos de energia continuarem subindo, os data centers acabarão atendendo apenas clientes com capacidade de pagar essa conta

Altos custos de compute para modelos de IA / em alta + custos de inferência por token em queda = convergência de desempenho + aumento no uso por desenvolvedores

O treinamento de grandes modelos de linguagem (LLMs) é uma das tarefas mais intensivas em custo da história da humanidade, e, à medida que o número de parâmetros e a complexidade dos algoritmos aumentam para melhorar o desempenho, os custos de treinamento disparam para bilhões de dólares
- Quanto mais se intensifica a corrida para construir os melhores modelos de uso geral, mais difícil fica diferenciar a qualidade dos resultados e sustentar a rentabilidade, gerando um fenômeno de “convergência”
Em contrapartida, os custos de inferência estão caindo rapidamente
- Por exemplo, a GPU NVIDIA Blackwell de 2024 consome 105 mil vezes menos energia por token do que a Kepler de 2014
- Graças à inovação em hardware e à melhoria da eficiência algorítmica dos modelos, o custo de inferência por token está caindo rapidamente
A queda no custo de inferência intensifica a concorrência entre fornecedores de LLMs
- A disputa não é apenas por precisão, mas também por latência, disponibilidade e preço por token
- Os custos em dólar já caíram para alguns centavos e logo devem ficar abaixo de 1 centavo
Do ponto de vista dos usuários (desenvolvedores), isso torna possível o acesso a IA poderosa a baixo custo
- O desenvolvimento de novos serviços e produtos está se acelerando, e o número real de usuários e casos de uso também cresce rapidamente
Para os fornecedores de modelos, surgem novos desafios: queda de rentabilidade e mudança no modelo de negócios
- Com treinamento caro e oferta barata, estão sendo buscadas novas estratégias, como integração vertical/horizontal e mercados de LLMs especializados
- Os LLMs de uso geral começam a assumir um caráter de guerra de desgaste sem rentabilidade
- Com o surgimento de modelos menores e customizados, ganha força a experimentação de estruturas de receita diferenciadas em relação aos grandes modelos tradicionais

Custos de inferência por token em queda

A redução dos custos de inferência de IA repete um padrão clássico da evolução da computação
- Como disse o CTO da Microsoft Nathan Myhrvold em 1997, “software é como gás: ocupa todo o recipiente disponível”; da mesma forma, a demanda por IA está crescendo até usar toda a infraestrutura disponível
- Quanto melhor o desempenho dos modelos, mais o uso (queries, tokens, número de modelos) explode, e o escopo e a frequência de uso da inteligência artificial também se expandem rapidamente
A velocidade de avanço da infraestrutura também está em nível recorde
- Em 2024, a GPU NVIDIA Blackwell melhorou a eficiência energética na geração de tokens em 105 mil vezes em relação à Kepler de 2014
- Isso significa que não se trata apenas de redução de custo, mas do resultado de inovações em arquitetura de hardware e materiais
A melhora na eficiência do hardware é um fator central para compensar a carga elétrica da crescente demanda por IA e internet
- Mas, até agora, essas melhorias por si só ainda não conseguiram impedir completamente o aumento da demanda total de eletricidade
- Esse fenômeno é semelhante ao Paradoxo de Jevons, de 1865
  - Quanto maior a eficiência no uso de recursos, maior pode ser o consumo total, e esse paradoxo também se repete na IA
Em consequência, a antiga fórmula da tecnologia — queda de custo, melhora de desempenho e aumento de uso — também está se repetindo na IA
- O avanço da infraestrutura volta a estimular o aumento do uso de IA, gerando novas preocupações com infraestrutura elétrica e produção de energia

Desempenho convergindo

Rápida convergência entre os modelos de IA no topo do ranking de desempenho
- Segundo os dados do LMSYS Chatbot Arena da Stanford HAI (2024~2025), as pontuações de avaliação de chatbot de três modelos — Google, OpenAI e DeepSeek — ficaram em 1.385, 1.366 e 1.362, restando apenas uma diferença mínima de cerca de 1% a 2%
- Ao longo de um ano, a diferença de pontuação entre os modelos líderes foi diminuindo cada vez mais, deixando clara a tendência de que a competição por desempenho está se nivelando na prática
Está cada vez mais difícil diferenciar a qualidade entre os mais recentes grandes modelos de linguagem (LLMs)
- Do ponto de vista do usuário, forma-se um cenário em que “qualquer modelo parece quase igual”
- Os fornecedores de modelos provavelmente vão migrar para uma competição baseada em fatores não ligados ao desempenho, como custo, estabilidade do serviço e recursos especializados

Uso por desenvolvedores em alta

A explosão da atividade de desenvolvedores de AI decorre da queda drástica nos custos de inferência e da maior acessibilidade a modelos capazes
- Entre 2022 e 2024, o custo por token para executar modelos de linguagem caiu cerca de 99,7%
  - Isso foi impulsionado por avanços expressivos em hardware e eficiência algorítmica
  - Uma tecnologia que antes só era acessível a grandes empresas agora pode ser usada com facilidade também por desenvolvedores individuais, criadores independentes de apps, pesquisadores e pequenos negócios
- O colapso dos custos tornou a experimentação barata e acelerou iteração e productização
  - Qualquer pessoa com uma ideia agora consegue desenvolver serviços de AI com facilidade
À medida que o desempenho dos modelos converge rapidamente, a fórmula de escolha de modelo está mudando
- A diferença entre os grandes modelos de ponta e alternativas menores e mais eficientes está diminuindo
- Em várias tarefas reais, como resumo, classificação, extração e roteamento, quase não há diferença de desempenho na prática
- Agora, desenvolvedores podem obter resultados parecidos por meio de modelos mais baratos ou de execução local/APIs de baixo custo, em vez de modelos premium caros
- O efeito é maximizado especialmente quando há fine-tuning com dados específicos da tarefa
Essa mudança enfraquece a alavanca de preços do "establishment" dos modelos e promove a democratização do desenvolvimento de AI
- Em vez de depender de um único provedor (vendor), passa a ser possível combinar e distribuir o uso entre modelos de diferentes ecossistemas
- OpenAI ChatGPT, Meta Llama, Mistral Mixtral, Anthropic Claude, Google Gemini, Microsoft Phi etc.
  - Entre modelos com pontos fortes distintos, torna-se possível escolher o modelo ideal de acordo com necessidades técnicas e financeiras
- Saída do lock-in de plataforma (dependência), com transição para uma era de escolha e distribuição liderada por desenvolvedores
Um flywheel de crescimento de infraestrutura impulsionado por desenvolvedores está se formando
- À medida que mais desenvolvedores criam apps AI-native, cresce rapidamente o ecossistema de ferramentas/wrappers/bibliotecas/frameworks
- Frameworks de frontend, pipelines de embedding, roteadores de modelo, vector DBs, camadas de serving etc.
  - Cada onda de atividade dos desenvolvedores reduz a barreira de entrada da onda seguinte
O tempo entre ideia e protótipo, e entre protótipo e produto, está diminuindo
- Não só os custos, mas também a complexidade, estão caindo rapidamente
- Mais do que uma mudança de plataforma, está se abrindo uma era de explosão criativa
Historicamente, o padrão se repete: plataformas com muitos desenvolvedores (e uso/adoção contínuos) acabam vencendo
- Como visto no discurso “Developers! Developers! Developers!” de Steve Ballmer, da Microsoft, os desenvolvedores são importantes
- A plataforma que conquistar a adoção dos desenvolvedores e sustentar escala e melhoria contínuas acabará dominando o mercado

The AI Developer Next Door

Forte alta na adoção de ferramentas de desenvolvimento com AI (2023~2024, Stack Overflow)
- Em 2024, em comparação com 2023, a proporção de desenvolvedores que usam ferramentas de AI aumentou bastante
- Entre desenvolvedores profissionais, subiu de 44% para 63%; entre pessoas aprendendo a programar, de 55% para 65%
Explosão de repositórios open source de desenvolvedores de AI (GitHub, 2022.11~2024.3)
- O número de repositórios de desenvolvedores de AI no GitHub aumentou cerca de 175% em 16 meses
- Após o surgimento de modelos/ferramentas importantes como ChatGPT e Stable Diffusion, o ecossistema de desenvolvimento cresceu de forma explosiva
Expansão do ecossistema de desenvolvedores de AI (segundo o Google, uso mensal de tokens)
- De 10 trilhões de tokens em maio de 2024 para 480 trilhões em maio de 2025, um aumento de 50 vezes em apenas um ano
- O uso por desenvolvedores se ampliou fortemente por meio do Google Gemini, AI API etc.
Crescimento do ecossistema Microsoft Azure AI Foundry (uso trimestral de tokens)
- De 20 trilhões no 1º trimestre de 2024 para 100 trilhões de tokens no 1º trimestre de 2025, crescimento de 5 vezes
- Mais de 70 mil empresas e desenvolvedores já utilizam a plataforma
Diversificação dos casos de uso por desenvolvedores de AI (2024, segundo a IBM)
- Geração de código, detecção/correção de bugs, automação de testes, gestão de projetos/workflows, documentação, refatoração/otimização, reforço de segurança, CI/CD, design de UX, arquitetura de sistemas etc.: o uso de AI está acelerando em uma ampla gama de áreas

AI Usage + Cost + Loss Growth = Unprecedented

O crescimento da AI, seus custos e o tamanho das perdas estão aumentando em um nível sem precedentes
- Sinais de alerta como “desta vez é diferente”, “dá para acertar a rentabilidade com economia de escala” e “vamos monetizar os usuários depois” costumavam levar ao fracasso, mas no caso dos investimentos das big techs também houve casos reais de sucesso
- A disputa atual em AI envolve simultaneamente capital em escala sem precedentes e grandes empresas guiadas por fundadores
- A competição entre potências globais como Estados Unidos e China acelera a inovação em AI
Em cada grande momento de adoção tecnológica, há um ponto de inflexão
- No computador pessoal, Macintosh (1984) e Windows 3.0 (1990); na internet, o IPO da Netscape (1995); no mobile, a App Store do iPhone (2008); na nuvem, a AWS (2006~09); em AI, NVIDIA A100 (2020) e ChatGPT (2022) foram gatilhos decisivos
- Em 2025, o surgimento da chinesa DeepSeek deu o sinal de largada para a intensificação da competição global em AI
Os recursos para sustentar o crescimento da AI vêm do enorme fluxo de caixa das gigantes de tecnologia e do capital global
- A combinação de competição intensa, capital e espírito empreendedor acelera o avanço da AI
Ainda assim, segue incerto qual será o modelo de negócio vencedor no fim

Technology Disruption Pattern Recognition = Hundreds of Years of Consistent Signals

Na história da inovação tecnológica, repete-se o ciclo de superaquecimento inicial, entrada de capital, intensificação da competição e separação entre vencedores e perdedores
- Exemplos: ferrovias no século XIX, a bolha dos anos 1840, colapso das expectativas etc.
Tecnologias que exigem grandes aportes de capital costumam ter retornos decepcionantes no início, mas, quando dão certo, mudam a estrutura industrial no longo prazo
- Porém, se não estiverem protegidas da concorrência, embutem alto risco
O vencedor final nem sempre é quem tem a melhor tecnologia, mas quem leu com mais clareza o movimento do mercado e da indústria
Em mercados sem barreiras de entrada, a vantagem de pioneirismo desaparece rapidamente
- Vale relembrar a lição: “É difícil prever os vencedores de uma nova tecnologia, mas é fácil ver os perdedores”

AI-Related Monetization = Very Robust Ramps

Evolução da estratégia de hardware para AI: o comando sobre o design de chips está migrando dos vendors tradicionais para as empresas de plataforma
- As GPUs da NVIDIA vêm atuando há muito tempo como o motor básico de treinamento/inferência em AI, garantindo uma posição incomparável
- Devido à explosão da demanda, mesmo com a rápida expansão da produção pela NVIDIA, a escassez de oferta continua, e hyperscalers e provedores de nuvem estão diversificando a cadeia de suprimentos
Ascensão dos chips customizados (ASICs): acelera a adoção de ASICs otimizados para operações específicas de AI em comparação com GPUs de uso geral
- Os chips TPU do Google e Trainium da Amazon estão se consolidando como elementos centrais do stack de AI de cada empresa
  - O Amazon Trainium2 oferece preço/desempenho 30% a 40% superior em relação a GPUs comuns, permitindo reduzir o custo de inferência em larga escala
- Esses chips customizados não são apenas experimentos, mas uma estratégia central para desempenho, economia e controle de arquitetura
Amplia-se o esforço para melhorar a economia da infraestrutura de AI
- Andy Jassy, CEO da Amazon: "A AI não precisa necessariamente ser tão cara quanto é agora, e no futuro ficará mais barata"
- O silício customizado é um dos principais meios para reduzir os custos da infraestrutura de AI
Crescimento de empresas especializadas em infraestrutura de AI
- CoreWeave: cresceu rapidamente ao reorganizar uma cadeia de suprimentos de hardware de games e cripto em uma nuvem de GPUs para AI
- Oracle: fez a transição do IT tradicional para uma plataforma de nuvem com GPUs especializada em AI
- Astera Labs: fornece interconexões de altíssima velocidade entre GPU e memória, ajudando a superar limites de desempenho em modelos de grande escala
Essas empresas não desenvolvem diretamente modelos fundacionais, mas constroem a infraestrutura essencial desse ecossistema
- Com o aumento explosivo da demanda por computação, velocidade, disponibilidade e eficiência emergem como fatores centrais de competitividade

AI Monetization = Chips

As receitas de chips de AI de grandes empresas como NVIDIA, Google e Amazon estão crescendo rapidamente
- A receita trimestral da NVIDIA cresceu 78% na comparação anual, ultrapassando US$ 39 bilhões, com foco principal na divisão de data center
- Nos últimos 10 anos, a receita da NVIDIA cresceu 28 vezes, e os investimentos em CapEx + P&D das big techs dos EUA (Apple, Microsoft, Alphabet, Amazon, Meta e NVIDIA) também aumentaram 6 vezes
- A receita de TPUs (Tensor Processing Units) do Google é estimada em US$ 8,9 bilhões, com crescimento anual de 116%
  - O Google TPU é um chip ASIC especializado no treinamento de modelos de AI, com mais de 100 mil unidades produzidas de forma acumulada desde o lançamento da primeira versão em 2015
- A receita dos chips AWS Trainium da Amazon deve crescer 216% ao ano, chegando a US$ 3,6 bilhões em 2025
  - O Trainium2 oferece vantagem de preço/desempenho de 30% a 40% em relação a instâncias tradicionais baseadas em GPU, com desempenho até 4 vezes maior
Contexto do crescimento do mercado de chips de AI
- Com o rápido aumento da demanda por treinamento e inferência de AI, a procura por chips de alto desempenho como GPUs e ASICs está explodindo
- As principais empresas de nuvem e hyperscalers estão concentradas em fortalecer o design de chips próprios e a cadeia de suprimentos, elevando a competitividade de preços e a eficiência da infraestrutura
- Chips especializados em AI, como GPU, TPU e Trainium, estão se consolidando como a principal fonte de receita dos data centers e como fator decisivo da competitividade da infraestrutura de AI

AI Monetization = Compute Services

Crescimento do mercado de serviços de computação para AI
- A receita de 2024 da CoreWeave, empresa de nuvem especializada em infraestrutura de AI, cresceu 730% na comparação anual, chegando a US$ 1,9 bilhão
- O crescimento do negócio foi acelerado por grandes contratos com clientes importantes como a OpenAI, IPO e a aquisição da Weights & Biases
- Com a explosão da demanda por infraestrutura de nuvem de alto desempenho para workloads de AI, segue o crescimento ultrarrápido de receita das empresas fornecedoras de infraestrutura
Expansão do mercado de infraestrutura de AI
- A receita de infraestrutura de AI da Oracle cresceu 50 vezes em dois anos, alcançando US$ 950 milhões em 2024 (estimativa da Morgan Stanley)
- Com o aumento da demanda por infraestrutura de AI, há grandes novos contratos de clientes em espera, além de reservas expressivas que ainda não foram efetivamente atendidas
- O CEO da Oracle mencionou que, com a corrida de clientes por infraestrutura de AI, há “mais de 40 novos contratos acima de US$ 1 bilhão”
Crescimento da conectividade de infraestrutura de AI
- A Astera Labs registrou crescimento de 242% na receita em 2024 na comparação anual, atingindo US$ 396 milhões
- Sua linha de produtos de conectividade de alta velocidade, como PCIe, CXL e Ethernet, está sendo aplicada em vários clientes e plataformas, consolidando-se como infraestrutura essencial dentro de data centers de AI, incluindo conectividade de GPU e clusters de aceleradores de AI no backend
Coleta de dados para AI e supercomputação
- A Tesla aumentou sua capacidade de treinamento de AI em 8,5 vezes em relação a junho de 2021 (base de setembro de 2024), com o supercomputador Dojo e adoção em larga escala de GPUs
- O Dojo é avaliado como tendo enorme potencial não só para inovar no custo de treinamento interno, mas também para se transformar em um serviço externo, como a AWS
- Elon Musk afirmou que “o potencial do Dojo é muito grande”

AI Monetization = Data Layer

A monetização da camada de dados para AI está se acelerando
A Scale AI aumentou a receita em 160%, de US$ 335 milhões em 2023 para US$ 870 milhões em 2024
- Fornece infraestrutura essencial para a expansão de LLMs de fronteira, incluindo rotulagem de dados, avaliação e construção de pipelines
- Apresentou a visão de que “abundância de dados é uma escolha, e não deixaremos os limites da AI serem definidos pela escassez de dados”
- Garantiu mais de US$ 1,5 bilhão em novos contratos apenas em 2024
A VAST Data alcançou US$ 2 bilhões em receita acumulada entre janeiro de 2019 e maio de 2025
- Simplifica a camada de infraestrutura de AI e fornece serviços de armazenamento, gerenciamento e processamento de dados
- Com a ascensão dos modelos de AI Reasoning, a importância da infraestrutura de dados ganha destaque
- Ressaltou que “para realizar o maior potencial na era da AI, o essencial é simplificar os problemas fundamentais”

Alto crescimento de receita, enorme consumo de caixa, alta valorização, grande volume de investimento = boa notícia para o consumidor, para o resto ainda é incerto

À medida que cresce a base global de usuários digitais e aumenta o potencial de explosão no uso, a área de investimento corporativo está se tornando cada vez mais competitiva e intensiva em capital
- A destruição criativa do ciclo tecnológico da AI mostra semelhanças com o processo de crescimento das grandes empresas de TI do passado
Casos de grandes empresas de tecnologia do passado, como Apple, Amazon, Google, Uber e Tesla:
- Apple: saiu de um valor de mercado de US$ 1,7 bilhão em 1997, à beira da falência, para US$ 3,2 trilhões hoje
- Amazon: prejuízo de US$ 545 milhões em 2000, prejuízo acumulado de US$ 3 bilhões ao longo de 27 trimestres após a fundação; nos 27 trimestres mais recentes, registrou US$ 176 bilhões em lucro líquido, com valor de mercado de US$ 2,2 trilhões
- Google: na época do IPO em 2004, investia 22% da receita de US$ 390 milhões em CapEx, e foi de US$ 23 bilhões em valor de mercado no IPO para US$ 2 trilhões hoje
- Uber: queimou US$ 17 bilhões em caixa entre 2016 e 2022, teve seu primeiro lucro em 2023, e passou de US$ 82 bilhões em valor de mercado no IPO para US$ 189 bilhões hoje
- Tesla: queimou US$ 9,2 bilhões entre 2009 e 2018; após seu primeiro lucro em 2019, registrou US$ 40 bilhões de lucro líquido em cinco anos, com valor de mercado atual de US$ 1,1 trilhão
Todas essas empresas suportaram investimentos agressivos e prejuízos de longo prazo para construir efeitos de rede baseados em dados e vantagens competitivas baseadas em tecnologia, provando no fim seu valor no mercado
No fim das contas, o valuation corporativo deve ser justificado pelo valor presente do fluxo de caixa livre futuro
No campo da AI, também será o tempo que provará quais players conseguirão gerar receita sustentável

Usage + Cost + Loss Growth = níveis sem precedentes… e a monetização e os lucros do futuro?

AI Monetization Possibilities = New Entrants & / Or Tech Incumbents?

Para entender para onde vai a estrutura econômica dos modelos de AI, é preciso observar a tensão entre capacidade e custo
O treinamento de LLMs gigantescos é uma das tentativas mais caras da história da humanidade, e os custos estão disparando para a casa dos bilhões de dólares com o aumento dos parâmetros e da complexidade da arquitetura
Por outro lado, o custo de inferência (Inference) está caindo drasticamente graças à inovação em hardware e à eficiência algorítmica
- Exemplo: a GPU Blackwell 2024 da NVIDIA reduziu a energia por token em 105.000 vezes em comparação com a Kepler de 2014
À medida que a inferência fica mais barata, a competição entre fornecedores de LLM em precisão, latência, disponibilidade e custo por token se intensifica, e tarefas antes caras agora passam a ser viáveis a custo quase desprezível
Para usuários e desenvolvedores, a queda no custo unitário se torna uma oportunidade, impulsionando uma explosão de novos serviços e casos de uso
Já para os fornecedores de modelos, a monetização e o modelo de lucro ficam mais incertos
- O treinamento continua caro, mas a entrega (serving) fica mais barata, enfraquecendo o poder de precificação
- O surgimento do mercado de modelos pequenos customizados enfraquece os moats tradicionais de negócio
Exemplo: o Google introduziu o AI Overviews na busca em maio de 2024 (1,5 bilhão de MAU em abril de 2025) e recentemente começou a aplicar anúncios em parte dele
Daqui para frente, a competição deve acelerar em estratégias de plataforma (expansão horizontal), aplicações especializadas e diversos modelos de monetização, como assinatura e publicidade
No curto prazo, a economia dos LLMs de uso geral está se aproximando cada vez mais de prejuízos em nível de venture e da competição por comoditização

AI – New Entrants = Rapidly Laying Groundwork

Situação da adoção de modelos de assinatura para consumidores pelos principais provedores de modelos fundacionais de IA (em maio de 2025)
- Diversos modelos, como OpenAI ChatGPT, xAI Grok, Google Gemini, Anthropic Claude e Perplexity, oferecem planos gratuitos/pagos por assinatura
  - OpenAI ChatGPT: $0 (gratuito) / $20 (Plus) / $200 (Pro) (por mês)
  - xAI Grok: $0 (gratuito) / $3 (Basic) / $8 (Premium) / $40 (Premium+) (por mês)
  - Google Gemini: $0 (gratuito) / $19.99 (AI Pro) / $250 (AI Ultra) (por mês)
  - Anthropic Claude: $0 (gratuito) / $17 (Plus) / $100 (Max) (por mês)
  - Perplexity: $0 (gratuito) / $20 (Pro) (por mês)
Situação da adoção de planos de preços de API para desenvolvedores pelos provedores de modelos fundacionais de IA (em maio de 2025)
- OpenAI, xAI Grok, Google Gemini, Anthropic Claude e Perplexity cobram valores por unidade de chamada de API
  - OpenAI ChatGPT: $0.40 por 1 milhão de tokens (GPT-4.1 nano) ~ $40 (o3)
  - xAI Grok: $0.50 por 1 milhão de tokens (grok-3-mini-beta) ~ $25 (grok-3-fast)
  - Google Gemini: $0.15 por 1 milhão de tokens (1.5 Flash-8B) ~ $15 (2.5 Pro Preview)
  - Anthropic Claude: $1.25 por 1 milhão de tokens (Claude 3 Haiku) ~ $75 (Claude 3 Opus)
  - Perplexity: $1 por 1 milhão de tokens (Sonar) ~ $15 (Sonar Pro)

AI – New Entrants = Rapid Revenue Growth

Crescimento no número de assinantes pagos e na receita anual da OpenAI (outubro de 2022 ~ abril de 2025)
- O número de assinantes pagos do ChatGPT cresceu 153% ao ano, chegando a cerca de 20 milhões em abril de 2025
- A receita anual da OpenAI cresceu 1050%, ultrapassando US$ 3,7 bilhões em abril de 2025
A receita anualizada da Anthropic baseada em API e busca generativa cresceu 20x em 18 meses (US$ 2 bilhões)
- Estratégia de novos modelos centrados em reasoning, como Claude 3.7 Sonnet, e ampliação do uso de IA voltado a tarefas reais de trabalho
- Crescimento de 6,4x em 1 ano
A receita anualizada da Perplexity baseada em busca generativa cresceu 7,6x em 14 meses (US$ 120 milhões)
- Destaque para a oferta de fontes de referência em todas as respostas e para a função de assistente de pesquisa personalizado
A receita anualizada da Glean com busca corporativa e agentes cresceu 10x em 24 meses (US$ 100 milhões)
- Projetada para apoiar a adoção de IA por grandes empresas e permitir o uso do conhecimento de toda a organização
Empresas de IA (top 100) levam em média 24 meses para alcançar receita anualizada de US$ 5 milhões
- Ritmo 35% mais rápido que empresas SaaS tradicionais (média SaaS de 37 meses, média IA de 24 meses)

AI –Tech Incumbents = Broad & Steady Product / Feature Rollouts

Situação global de usuários e dispositivos de IA dos Tech Incumbents, em comparação com os usuários do ChatGPT (800 milhões)
- Google, Meta, Apple, TikTok, Microsoft, Spotify, Amazon, X, Canva e outras empresas estão expandindo gradualmente seus produtos de IA com base em centenas de milhões a bilhões de usuários
Canva – Background Remover & Magic Media (12/19)
- O recurso de remoção de fundo de imagem, lançado em 2019, manteve popularidade constante e já foi usado mais de 3 bilhões de vezes no total
- O Magic Media (texto→imagem/vídeo), lançado em 2024, gerou mais de 290 milhões de criações em apenas 1 ano, mostrando forte resposta da comunidade
Spotify – AI DJ (2/23)
- Recursos inovadores como AI DJ e videoclipes com IA foram lançados globalmente a partir de fevereiro de 2023 e, em maio de 2024, já estavam disponíveis em mais de 60 países
- O AI DJ eleva a satisfação dos usuários e a qualidade do serviço do Spotify com recomendações musicais personalizadas, interação e funcionalidades de reasoning em tempo real baseadas em dados
Microsoft – Copilot (2/23)
- A Microsoft introduziu o Copilot no Bing e no Edge em fevereiro de 2023 e registrou mais de 15 bilhões de conversas acumuladas até dezembro de 2024
- O Copilot oferece uma nova experiência de usuário baseada em IA em busca na web, navegador e ferramentas de escritório, contribuindo para maior eficiência e criatividade no trabalho diário
Meta Platforms – Meta AI (9/23)
- Em abril de 2025, o Meta AI estava próximo de 1 bilhão de usuários ativos mensais (MAU) somando todos os apps, como Instagram, Messenger e WhatsApp
- A estratégia futura enfatiza liderar o desenvolvimento de agentes de IA no nível de engenheiros intermediários e garantir protagonismo em pesquisa e aplicação de IA no campo
X – Grok (11/23)
- Com o lançamento da versão 3.0 em fevereiro de 2025, o Grok da xAI viu os visitantes globais de desktop saltarem 42x em relação ao mês anterior, superando 150 milhões
- Há ênfase na busca da verdade pela IA (value alignment) e na implantação em larga escala, enquanto a experiência de IA continua se expandindo dentro da plataforma X
Google – Gemini & AI Overviews (12/23)
- Em maio de 2024, o chatbot Gemini tinha 400 milhões de MAU, enquanto o AI Overviews, embutido na busca do Google, alcançou 1,5 bilhão de usuários mensais
- Os pontos fortes estão no modelo de IA multimodal que abrange vários tipos de dados (texto, código, imagem, áudio etc.) e nos resumos com IA dentro da busca
Amazon – Rufus (2/24)
- A Amazon introduziu o Rufus AI no varejo da América do Norte em fevereiro de 2024, melhorando recomendações personalizadas em informações de produtos e resumos de avaliações
- Junto com o crescimento do GMV do negócio de varejo, o uso de IA continua se ampliando
TikTok – Symphony AI Assistant (6/24)
- Desde a introdução do Symphony Assistant em junho de 2024, o site global do TikTok registrou mais de 2 bilhões de visitantes
- A IA tem gerado resultados concretos em criação de conteúdo para marcas e criadores, eficiência de anúncios e afinidade com a marca
Apple – Apple Intelligence (10/24)
- Entre setembro de 2024 e março de 2025, as vendas de dispositivos compatíveis com Apple Intelligence, como iPhone 15 Pro/Pro Max e a linha iPhone 16, chegaram a 50 milhões ~ 70 milhões de unidades
- O foco está em oferecer experiências de IA baseadas em personalização, privacidade e computação local por meio da integração entre hardware e software

AI –Tech Incumbents = Rapid Revenue + Customer Growth

Receita de produtos de IA da Microsoft
- Em 2024, a estimativa de receita anual da divisão de produtos de IA da Microsoft chegou a US$ 13 bilhões, alta de 175% em relação ao ano anterior
- Diversas linhas de produtos de IA, como Azure AI Services, Microsoft 365 Copilot e Dynamics 365 Copilot, impulsionaram o crescimento da receita
- O CEO Satya Nadella afirmou que a empresa “está ajudando a concretizar o retorno sobre investimento (ROI) em IA e aproveitando uma enorme oportunidade”
- Na divulgação de resultados do 1º trimestre de 2025, destacou que as reservas comerciais (Commercial bookings) cresceram 18%
xAI: busca generativa
- Em 2025, a receita anual da xAI deve começar a crescer de forma significativa
- O modelo mais recente, Grok 3, baseado no supercomputador Colossus, alcançou melhorias de desempenho em tarefas avançadas de raciocínio, matemática, programação e conhecimento, com mais de 10 vezes a capacidade computacional
- O CEO Elon Musk enfatizou que se trata de uma “IA orientada à busca da verdade, mesmo que seja uma verdade politicamente incômoda”
Clientes comerciais da Palantir nos EUA
- A Palantir alcançou 432 clientes comerciais nos EUA, com crescimento de 65% em um ano
- Sua plataforma de IA, AIP (Artificial Intelligence Platform), contribuiu para conquistar novos clientes e expandir a base existente
- Em base anual de 2025, a receita comercial nos EUA ultrapassou US$ 1 bilhão
- A competitividade da Palantir está em “maximizar o contexto dentro das empresas por meio da AI Ontology e oferecer capacidade de execução diferenciada”

Possibilidades de monetização de IA – Enterprise = plataforma horizontal e/ou software especializado?

Direção da monetização de IA no mercado corporativo
- O software empresarial tradicional cresceu como ferramentas especializadas para setores e funções específicas (Vertical SaaS)
- Soluções especializadas por setor, como Toast (restaurantes), Guidewire (seguros) e Veeva (ciências da vida), lideram seus respectivos mercados
- No entanto, com o surgimento dos modelos fundacionais e da IA generativa, novas oportunidades de monetização estão se abrindo em várias áreas
Ascensão das plataformas horizontais
- Estão surgindo plataformas corporativas horizontais que integram produtividade nativa em IA, busca, comunicação e gestão do conhecimento em uma única interface
- Exemplo: um formato que combina Slack + Notion + ChatGPT, incorporando inteligência de IA ao contexto de trabalho de toda a organização em vez de manter SaaS isolados
- Há uma migração de valor da venda de licenças SaaS para modelos de cobrança baseados em resultados gerados com IA embutida
Competição entre plataformas horizontais e software especializado
- A Microsoft está integrando o Copilot em toda a empresa, enquanto Zoom e Canva incorporam IA generativa aos fluxos de trabalho dos usuários
- Empresas como a Databricks estão integrando IA à pilha de dados e de desenvolvedores
- Startups como a Glean desafiam o modelo tradicional de suíte com fluxos de trabalho AI-first
- Por outro lado, fornecedores tradicionais de software especializado também estão reagindo, incorporando IA, automatizando fluxos de trabalho e adotando rapidamente modelos personalizados com dados específicos de cada setor
- Esses fornecedores especializados já contam com confiança, dados estruturados e fluxos de trabalho de campo, o que lhes dá vantagem na implantação de IA especializada por domínio
Perspectivas futuras
- As plataformas horizontais têm força na integração de múltiplas funções e conexão do conhecimento em toda a empresa
- Fornecedores especializados se diferenciam com recursos de IA profundos adaptados a regulamentações, contratos e contexto de clientes de cada setor
- A questão central será quem conseguirá abstrair a camada principal e dominar a interface do usuário e a lógica de trabalho
- Na era da IA, a monetização será definida não pelo uso simples, mas por “Attention”, “Context” e “Control”

Incumbentes de SaaS

Microsoft GitHub Copilot
- Lançamento oficial em junho de 2022
- Adotado por mais de 77.000 empresas
- Crescimento de 180% ano contra ano ao longo de 2 anos
- Comunidade de 150 milhões de desenvolvedores, alta de 50% em 2 anos
- Mais de US$ 500 milhões em receita anual (em base trimestral)
Microsoft 365 Copilot
- Anunciado em março de 2023, com oferta comercial geral para empresas iniciada em novembro de 2023
- Já no 1º trimestre após o lançamento, muitos clientes existentes ampliaram o número de assentos em mais de 10 vezes
- O número de usuários mais que dobrou a cada trimestre
- A taxa de uso pelos funcionários também disparou, com aumento recente de mais de 60%
- Mais de 75% dos CIOs planejam adotar a ferramenta nos próximos 12 meses
Adobe Firefly
- Beta público em março de 2023; modelo de vídeo com IA comercializado em fevereiro de 2024
- Bem avaliado por marcas e criadores
- O total de ativos gerados no Firefly ultrapassou 20 bilhões
- Mais de 90% dos usuários pagos já experimentaram geração de vídeo
- Usuários ativos mensais de GenAI no Photoshop e Lightroom chegaram a 35% e 30%, respectivamente
Atlassian Intelligence
- Beta em dezembro de 2023; ultrapassou 1 milhão de MAU em dezembro de 2024
- Em um ano, o uso dos recursos de IA cresceu 25 vezes
- Mais de 10% dos clientes adotaram o Atlassian Intelligence
Zoom AI Companion
- Lançado em setembro de 2023; 3,5 milhões de contas adotaram a ferramenta até dezembro de 2024
- O número de contas ativas cresceu 68% trimestre a trimestre
- O AI Companion 2.0 oferece recursos avançados como memória, raciocínio e integrações
Canva Magic Studio
- Lançado em outubro de 2023; uso acumulado das ferramentas de IA chegou a 16 bilhões de vezes em maio de 2025
- Utilizado por toda a comunidade de criadores, empresas e organizações sem fins lucrativos
- Mais de 10 bilhões de usos registrados das ferramentas de IA
Salesforce Agentforce
- Anunciado em setembro de 2024; até fevereiro de 2025, fechou 3.000 contratos pagos
- Em conjunto com o Data Cloud, impulsiona inovação em experiência do cliente em larga escala
- Mantém crescimento de ARR de IA acima de 120% ao ano

OpenAI ChatGPT = potencial plataforma horizontal corporativa?

Microsoft Office Suite
- Composto por 9 aplicativos (Outlook, Word, Excel, PowerPoint etc.)
- Conquistou mais de 400 milhões de usuários pagos ao longo de 34 anos (1990–2024)
OpenAI ChatGPT
- Apesar de ser um único aplicativo, alcançou 20 milhões de usuários pagos em apenas 2,5 anos (novembro de 2022–abril de 2025)
Expansão do ChatGPT Enterprise
- Em 9 meses após o lançamento, foi adotado por equipes em mais de 80% das empresas da Fortune 500
- As empresas usuárias responderam que preferem a facilidade de implantação e o modelo seguro
- As empresas que adotaram a ferramenta no início usam ativamente o ChatGPT Enterprise para melhorar a comunicação interna, acelerar tarefas de programação, responder rapidamente a perguntas de negócios complexas e apoiar trabalho criativo
- O ChatGPT Enterprise não tem limites de uso e oferece desempenho até 2 vezes mais rápido que a versão gratuita
- Também oferece acesso ilimitado a recursos de análise avançada de dados (antigo Code Interpreter)
- Entre agosto de 2023 e fevereiro de 2025, o número de usuários corporativos/de equipe/educacionais cresceu rapidamente para 2 milhões

Software especializado habilitado por IA em grandes setores de serviços = crescimento muito rápido

Engenharia de software
- Cursor AI: atingiu ARR (receita recorrente anual) de $1M → $300M em 25 meses
- O Cursor é um editor de código com IA que oferece uma experiência de usuário inovadora em escrita de código, refatoração e automação
- Mais de 1 bilhão de caracteres editados por dia, com mais de $100M em receita recorrente registrada
Desenvolvimento de produto (No-Code Product-Building)
- Lovable: crescimento de 13x no ARR em 5 meses, alcançando $50M
- Plataforma no-code baseada em IA que gera automaticamente código front-end/back-end, integração com DB e implantação a partir de ideias de produto em linguagem natural
- Ajuda qualquer pessoa a criar produtos rapidamente e começar um negócio
Saúde (conversas clínicas)
- Abridge: crescimento de CARR (receita recorrente contratada) de $50M → $117M em 5 meses
- Adotado por cerca de 25.000 profissionais de saúde, 40 hospitais e 600 instituições médicas; usado mais de 10 milhões de vezes para resumir registros de consultas de pacientes
- Muitos feedbacks positivos dos profissionais de saúde que utilizam a solução
Jurídico (automação de workflow)
- Harvey: crescimento de ARR de $10M → $70M em 15 meses, com 235 clientes em 42 países
- Adotado pela maioria dos 10 maiores escritórios de advocacia dos EUA, liderando a automação de workflows jurídicos/serviços profissionais e a inovação em eficiência
Suporte ao cliente (AI Support Agents)
- Decagon: crescimento de ARR de cerca de $1M → $10M em 1 ano
- Agentes de suporte com IA automatizam tarefas repetitivas, e as funções de atendimento ao cliente migram para o papel de gerente de IA
- Perspectiva de crescimento adicional em 2025
Serviços financeiros (pesquisa e análise)
- AlphaSense: crescimento de ARR de cerca de $150M → $420M em 2 anos
- Insights baseados em IA estão se consolidando como padrão de mercado, oferecendo soluções avançadas de inteligência de mercado e workflow
- Foco em inovação de produto e investimento em tecnologia, com continuidade do alto crescimento em 2025

Ameaças à monetização da IA = aumento da concorrência + impulso do open source + ascensão da China

Aumento da concorrência = lançamentos de modelos de IA

Desde o artigo sobre transformadores do Google de 2017, “Attention is All You Need”, começou a primeira onda de inovação em IA centrada em LLMs (grandes modelos de linguagem)
- O GPT-3 da OpenAI e o Llama-1 da Meta, entre outros, comprovaram o potencial de capacidades gerais de raciocínio por meio do treinamento em predição de texto em larga escala
No entanto, a comunicação humana não se limita apenas a texto
- Imagens, áudio, vídeo, dados de sensores e outros sinais transmitem com muito mais riqueza o contexto das situações reais
- Empresas como Google, Anthropic e xAI estão expandindo os modelos de linguagem para o multimodal (processamento de múltiplos formatos de dados)
  Evolução dos modelos de IA multimodais
- Integram texto, fotos, voz e vídeo em um único espaço vetorial para compreensão e geração
- Para uma única consulta, podem considerar ao mesmo tempo parágrafos + gráficos, e devolver a resposta como resumo em áudio ou imagem anotada
- Estrutura que transita livremente entre todos os formatos de dados sem necessidade de trocar de sistema
Principais exemplos de evolução por etapa
- 2021 OpenAI CLIP: integração de visão + linguagem
- 2023 Meta ImageBind, 2024 Chameleon: fusão de imagem, voz e vídeo
- 2024-2025 GPT-4o, Claude 3, Chameleon: surgimento de modelos de fronteira totalmente multimodais
Efeitos práticos no mundo real
- Engenheiros em campo verificam em tempo real diagnósticos de anomalias em equipamentos usando a câmera do smartphone
- Profissionais de saúde geram rascunhos estruturados de relatórios clínicos ao mesmo tempo em que anexam radiografias
- Analistas consultam gráficos, transcrições e clipes de áudio de uma só vez para análise integrada
- Menos troca de contexto em comparação com modelos baseados em texto, captura de informação mais rica e inovação em serviços centrados em visão e voz

Impulso dos modelos open source

O desenvolvimento de modelos de IA, no início (2012-2018), foi centrado em open source
- Com base na academia e na cultura de colaboração, modelos, código e dados eram publicados
Desde 2019, com comercialização, segurança e concorrência intensificada, surgiram os modelos fechados (closed source)
- A partir do lançamento do GPT-2, pesos e dados de treinamento dos principais modelos passaram a ser mantidos em sigilo
- OpenAI GPT-4, Anthropic Claude e outros operam como APIs, apoiados em grandes volumes de dados proprietários e capital intensivo
- Têm força em desempenho, usabilidade e confiabilidade, por isso são preferidos por grandes empresas, governos e consumidores
- Por outro lado, a falta de transparência sobre dados de treinamento, arquitetura do modelo e métodos de fine-tuning é uma limitação
Recentemente, os modelos open source voltaram a ganhar força
- Têm baixo custo de desenvolvimento e uso, além de alta acessibilidade, o que os torna populares entre startups, desenvolvedores e academia
- Em plataformas como Hugging Face, é fácil baixar e usar modelos recentes como Meta Llama e Mistral Mixtral
- O desenvolvimento de IA volta a se expandir dos grandes laboratórios para laboratórios individuais e comunitários
- Experimentação rápida, colaboração e participação da comunidade aceleram a inovação
A China é líder mundial em 2025 no número de grandes modelos de IA open source divulgados
- Grandes modelos lançados em 2025 incluem DeepSeek-R1, Alibaba Qwen-32B e Baidu Ernie 4.5
Diferenciação clara entre closed source e open source
- Open source: lidera IA soberana, modelos de linguagem localizados e inovação baseada em comunidade
- Closed source: mantém vantagem no mercado consumidor e na adoção por grandes empresas, com foco em otimização e usabilidade
- Esses dois paradigmas — abertura/velocidade/liberdade versus segurança/otimização/controle — competem entre si e moldam o futuro da IA

Melhor desempenho dos modelos open source + queda no custo por token = explosão no uso por desenvolvedores que usam IA

No início, modelos closed source como GPT-4, Claude e Gemini lideravam os mercados consumidor e corporativo
- Com onboarding simples, UI/UX refinada e alta confiabilidade, tinham vantagem em percepção pública e adoção empresarial
- Ofereciam segurança, conveniência e reconhecimento de marca que até profissionais não técnicos conseguiam usar facilmente
Recentemente, a diferença de desempenho dos modelos open source diminuiu rapidamente
- Llama 3, DeepSeek e outros atingiram um nível competitivo com modelos fechados em raciocínio, programação e multilinguismo
- Podem ser baixados livremente, ajustados com fine-tuning e implantados localmente, com custo muito menor
A adoção de modelos de IA open source está acelerando entre desenvolvedores
- Desenvolvedores preferem customização e baixo custo/alto desempenho a uma UX extremamente refinada
- Há intensa experimentação e inovação com base em modelos open source em apps, agentes, pipelines e várias outras áreas
Com a queda no preço dos tokens e a melhora de desempenho dos modelos open source, o número de desenvolvedores usando IA cresce de forma explosiva
- Antes havia alta dependência de APIs fechadas, mas agora já é possível construir e escalar diretamente tanto em ambientes locais quanto na nuvem
Ainda há limites para a popularização entre consumidores e grandes empresas
- Open source ainda tem pontos fracos em poder de marca, UX amigável e serviços gerenciados
- Mas, se a infraestrutura ficar mais conveniente e a vantagem de custo/desempenho se mantiver, há potencial de expansão também para o mercado de massa

Ascensão da China

O CTO da Meta, Andrew Bosworth, compara atualmente a IA a uma “corrida espacial (space race)” e avalia de forma muito alta, em especial, as capacidades da China
- Assim como a corrida espacial do passado tinha um caráter de competição entre sistemas (velocidade de inovação e credibilidade global), a disputa por IA também pode influenciar a ordem mundial
A China, a partir da política ‘Made in China 2025’ (Made in China 2025), passou rapidamente de manufatura de baixo custo para líder em tecnologias avançadas
- Fortalecendo rapidamente suas capacidades em indústrias estratégicas, com foco em robótica, eletrificação, tecnologia da informação e inteligência artificial de nível mundial
Aplicação militar e estratégica nacional da IA chinesa
- O uso de IA está se expandindo por toda a segurança nacional, incluindo logística de campo de batalha, reconhecimento de alvos, operações cibernéticas e plataformas autônomas de tomada de decisão
- Em 2025, a mídia estatal também destacou a aplicação de IA em áreas de apoio militar (não combate), como hospitais militares
- O Ministério da Ciência e Tecnologia deixou claro que ‘inovação autóctone (indigenous innovation)’ é uma tarefa central do país
Impacto global da vantagem chinesa em IA
- Sam Altman, da OpenAI, alertou em um artigo de 2024 que “se regimes autoritários assumirem a liderança em IA, poderão forçar empresas dos EUA e de outros países a compartilhar dados, além de usar IA para vigilância da própria população ou desenvolvimento de armas cibernéticas”
Aprofundamento da disputa por hegemonia tecnológica entre EUA e China
- A disputa pelo controle não envolve apenas IA, mas também terras raras, semicondutores e setores de tecnologia avançada
- A China mantém sua posição como potência global no fornecimento de terras raras (matéria-prima essencial para eletrônicos avançados, defesa e energia limpa), enquanto os EUA tentam conter isso por meio de reshoring de semicondutores (retorno da produção ao país) e do fortalecimento da cooperação com aliados (Japão, Coreia do Sul, Países Baixos etc.)
- A TSMC, de Taiwan, ocupa um papel central na manufatura global de semicondutores e está no centro dos cálculos estratégicos de EUA e China
Mudança de orientação política dentro dos EUA
- Depois de 20 anos de resposta morna, ambos os partidos passaram a reconhecer ativamente as indústrias de tecnologia avançada como ‘centrais para o interesse nacional’
- Governo Biden: controles de exportação; governo Trump: nacionalismo econômico e reshoring, entre outras abordagens
- Os senadores John Cornyn e Mark Warner: “A inovação americana em semicondutores sustentou toda a economia, mas a complacência abriu espaço para que países concorrentes (inclusive adversários) se aproximassem”
Importância da proteção da propriedade intelectual (IP) tecnológica dos EUA
- A OpenAI afirmou que “concorrentes como a China seguem tentando fazer engenharia reversa de modelos de IA líderes dos EUA, e uma cooperação estreita com o governo é indispensável”
Mudança de visão sobre as relações entre EUA e China
- Diferentemente do início da adesão à OMC (anos 2000), os EUA de hoje reconhecem claramente que tecnologias avançadas como IA, semicondutores e minerais críticos são um eixo central não apenas de ativos econômicos e industriais, mas também da resiliência nacional e do poder geopolítico

Public Market Capitalization Leader Tells of Last Thirty Years = Extraordinary USA Momentum…China Rising

Nos últimos 30 anos (1995~2025), entre as 30 maiores empresas globais por valor de mercado, apenas 6 permaneceram continuamente na lista
- Microsoft, Walmart, Exxon Mobil, Procter & Gamble, Johnson & Johnson, Coca-Cola
- Empresas que entraram no topo posteriormente
  - NVIDIA, Apple, Amazon, Alphabet(Google), Saudi Aramco, Meta Platforms(Facebook), Tesla, Broadcom, Berkshire Hathaway, TSMC, JP Morgan Chase, Visa, Eli Lilly, Tencent, Mastercard, Netflix, Costco Wholesale, Oracle, Home Depot, SAP, Bank of America, ICBC, AbbVie, Palantir
- Participação por país em 1995
  - EUA: 53% (16 das 30 empresas),
  - Japão: 9,
  - Suíça: 3,
  - Reino Unido: 2
- Participação por país em 2025
  - EUA: 83% (25 das 30 empresas)
  - Japão/Suíça/Reino Unido: 0
  - China 2, Arábia Saudita 1, Taiwan 1, Alemanha 1
Nos últimos 30 anos, entre as 30 maiores empresas globais de tecnologia (tech companies) por valor de mercado, apenas 5 permaneceram continuamente na lista
- Microsoft, Oracle, Cisco, IBM, AT&T
- Novas entradas entre as empresas de tecnologia
  - NVIDIA, Apple, Amazon, Alphabet(Google), Meta Platforms(Facebook), Tesla, Broadcom, TSMC, Tencent, Netflix, SAP, Palantir, ASML, Alibaba, Salesforce, T-Mobile, Samsung, China Mobile, Reliance, ServiceNow, Intuitive Surgical, Siemens, Uber, AMD, Intuit
- Participação por país entre empresas de tecnologia em 1995
  - EUA: 53% (16/30),
  - Japão: 30% (9/30),
  - Reino Unido/Singapura/Hong Kong/México/Malásia: 1 cada
- Participação por país entre empresas de tecnologia em 2025
  - EUA: 70% (21/30)
  - Japão/Reino Unido/Singapura/Hong Kong/México/Malásia: 0
  - China 3, Alemanha 2, Taiwan 1, Países Baixos 1, Coreia do Sul 1, Índia 1
- TSMC, de Taiwan: Taiwan tem apenas 1 empresa no topo (TSMC), mas, no 2º trimestre de 2024,
  - produziu de 80% a 90% dos semicondutores avançados do mundo e mais de 62% de todos os semicondutores
Uma transformação enorme ocorrida em apenas uma geração
- A popularização da internet serviu de base para o surgimento de novas empresas globais líderes e,
- projeta-se que a ascensão da IA acelere mudanças ainda mais rápidas e profundas nos próximos 30 anos

EUA vs. China em tecnologia = tempo de resposta da IA da China significativamente mais rápido que o da internet em 1995

Liderança em grandes modelos de linguagem (LLM) de IA: Estados Unidos e China lideram o ritmo do desenvolvimento global de IA
- Ao observar a situação acumulada de construção de sistemas de IA de grande escala entre 2017 e 2024, Estados Unidos e China estão isolados na liderança
- Em 2024, os Estados Unidos anunciaram mais de 150 casos, e a China também divulgou mais de 100 sistemas de IA de grande escala
- França, Reino Unido, Canadá, Hong Kong e Alemanha ainda mostram uma grande distância em relação a Estados Unidos e China
China AI = perseguição rápida, DeepSeek R1
- A DeepSeek anunciou que a capacidade de desenvolvimento de IA da China reduziu a diferença para os Estados Unidos para apenas 3 meses (janeiro de 2025)
- O CEO da DeepSeek enfatizou que a China precisa inevitavelmente ir além da simples imitação e avançar para uma inovação própria
Alibaba Qwen 2.5-Max: alega superar DeepSeek e OpenAI ChatGPT
- O Qwen2.5-Max demonstrou desempenho superior ao DeepSeek V3 e ao OpenAI ChatGPT em diversos benchmarks
- O desempenho do modelo continua melhorando por meio de inovações em escala de dados, tamanho do modelo e técnicas de pós-treinamento
Baidu Ernie 4.5 Turbo: IA multimodal, baixo custo e alto desempenho
- Uma IA multimodal que processa texto, imagem e vídeo, comparada a um “canivete suíço”
- Custo de RMB 0.8 por 1 milhão de tokens de entrada e RMB 3.2 de saída, equivalente a 40% do custo do DeepSeek V3 e 0,2% do GPT-4.5
- Apresentou desempenho equivalente ao GPT-4.1 e superior ao GPT-4o em algumas tarefas multimodais
Desempenho de LLM: Estados Unidos e China, diferença real de pontuação está diminuindo
- Segundo os resultados do Chatbot Arena da Stanford HAI & LMSYS em fevereiro de 2025, os Estados Unidos marcaram 1.385 pontos e a China 1.362, mostrando proximidade
IA chinesa: alcançando desempenho com menor custo de treinamento
- Segundo dados da Epoch AI, modelos chineses como o DeepSeek V3 foram lançados com custos significativamente menores que o GPT-4
Transição do treinamento de IA para semicondutores locais
- Com as restrições de exportação dos Estados Unidos, clusters locais de chips de IA, como os da Huawei, estão se expandindo rapidamente
- Segundo o Financial Times, a Huawei começou a fornecer em larga escala clusters de IA para empresas de tecnologia chinesas
China: base de instalação de robôs industriais também está no nível mais alto do mundo
- Em 2023, a China registrou 276 mil unidades, o resto do mundo 265 mil, e os Estados Unidos em torno de 40 mil, mostrando uma diferença clara
Conclusão: a velocidade da inovação em IA da China é muito mais rápida que a da fase inicial de adoção da internet (1995)
- A diferença em relação aos Estados Unidos está diminuindo rapidamente em tecnologia, custo e infraestrutura, enquanto a disputa pela liderança global da indústria fica ainda mais intensa

Uso de IA para o consumidor na China = DeepSeek cresceu rapidamente

O mercado global de IA generativa está se fragmentando cada vez mais por região, canal e preferência do usuário
- Globalmente, o ChatGPT da OpenAI ocupa uma liderança clara tanto em desktop quanto em mobile, mas a concorrência entre plataformas está se intensificando
- Claude, da Anthropic, e Google Gemini também estão ampliando gradualmente sua participação, enquanto o Grok, da xAI, foi registrado como o assistente de IA com crescimento mais rápido, com aumento mensal de 294% nas visitas entre fevereiro e março de 2025
Na China, modelos locais de IA como DeepSeek estão em alta
- O ChatGPT lidera na maioria dos países, mas, como não está disponível na Rússia e na China, modelos locais como o DeepSeek dominam
- Segundo a consultoria Roland Berger, os 10 principais apps de IA por usuários ativos mensais na China são todos nacionais (DeepSeek, Kimi, Nami AI, ERNIE Bot etc., com dezenas de milhões de usuários)
- No resto do mundo, excluindo a China, o ChatGPT é amplamente dominante; dentro da China, formou-se um mercado completamente separado
Regulação e ambiente de plataformas na China
- Facebook, Twitter, Google e YouTube estão inacessíveis na China desde 2010 ou antes
- Além de Instagram, WhatsApp, Wikipedia, Telegram e Spotify, mais recentemente ChatGPT, Google Gemini, Claude, Meta AI e Microsoft Copilot também foram bloqueados
- Esse ambiente regulatório impulsionou o surgimento de campeões locais de IA
Diferenças de percepção sobre a IA
- Segundo pesquisa da Stanford HAI e Ipsos, 83% dos cidadãos chineses avaliam positivamente o efeito líquido da IA (em 2024, alta de 5 pontos percentuais em relação a 2022)
- Entre os cidadãos dos Estados Unidos, apenas 39% responderam positivamente à mesma pergunta, sem grandes mudanças em dois anos
- Sob perspectivas sociais e filosóficas, a forma de abordar e aceitar a IA varia de país para país
**A escolha de plataforma vai além de desempenho ou preço e se expande gradualmente para o campo da identidade nacional e cultural **
- Já não se trata apenas de ‘quem faz melhor’, mas de ‘como isso é recebido e usado’, tornando-se um ponto de inflexão ainda mais importante

IA & Mundo físico aceleram = rápido + orientado por dados

Até agora, o foco esteve na difusão e monetização da IA em software para desktop/mobile, mas a inovação e a monetização da IA no mundo físico real estão se mostrando ainda mais rápidas e dramáticas
- Agora, a inteligência está profundamente incorporada não apenas em aplicações digitais, mas também em veículos, máquinas e sistemas de defesa
- Frotas de veículos autônomos como Waymo e Tesla já não são mais projetos de laboratório; estão gerando receita de fato, acumulando milhões de milhas de direção sem motorista e evoluindo rapidamente em loops de software cada vez mais sofisticados
- A Applied Intuition desenvolve sistemas de veículos definidos por software e plataformas de simulação independentes de hardware, permitindo que fabricantes apliquem inteligência artificial com a mesma facilidade de um componente
- Na indústria de defesa (Anduril), a IA está transformando o paradigma da defesa ao enviar sistemas autônomos com IA embarcada em cada nó de edge, como drones e sensores
- Na agricultura (Carbon Robotics), com visão computacional baseada em IA, ervas daninhas estão sendo removidas sem uso de herbicidas, marcando uma grande virada em que ativos de capital do mundo físico se tornam endpoints de software
- Isso sugere que a IA já não está restrita à tela e está se tornando uma força cinética que move a realidade
Tesla Vertically-Integrated Electric Vehicles
- De junho de 2022 a março de 2025, a quilometragem acumulada de condução autônoma total (Full Self-Driving) cresceu 100x
- Com a introdução da versão 12, 330 mil linhas de código C++ foram substituídas por redes neurais, com adoção de uma arquitetura de IA end-to-end completa
- A IA desempenha papel central em todas as etapas, incluindo reconhecimento de objetos, planejamento de rota e controle do veículo
- É possível que a Tesla seja a empresa mais eficiente do mundo em inferência de IA
Waymo Fully-Autonomous Vehicles
- De agosto de 2023 a abril de 2025, a participação no mercado de rideshare em San Francisco disparou de 0% para 27%
- Construção de um sistema comercial robusto com perception, planning e prediction baseados em IA multimodal
- Comprovou no mercado real um produto de veículo autônomo comercialmente viável
Applied Intuition Vehicle Intelligence
- Em 2024, fornecia soluções de inteligência veicular com IA para 18 grandes OEMs automotivos globais
- Expansão da plataforma de simulação e do software de direção autônoma para diversos setores, incluindo automóveis, caminhões, construção e defesa
- No setor de defesa, fortaleceu sua linha de produtos de direção autônoma off-road e tecnologias militares
Anduril AI-Enabled Autonomous USA Defense Systems
- Entre 2022 e 2024, dobrou a receita anual por dois anos consecutivos, superando US$ 1 bilhão em 2024
- Usa IA e sistemas autônomos para apoiar decisões mais rápidas e precisas no ambiente moderno de campo de batalha
- Inova sistemas de segurança e defesa ao distribuir IA por cada nó de edge descentralizado
KoBold Metals AI-Driven Mining Exploration
- Com tecnologia de machine prospector baseada em IA, melhorou dramaticamente a eficiência da exploração mineral, setor que mostrava a pior eficiência desde 1975
- Combina grandes volumes de dados geográficos/geofísicos com modelos estatísticos de correlação para identificar rapidamente candidatos promissores à exploração
- Garante novas cadeias de suprimento de metais com mais do que o dobro da eficiência da média do setor
Carbon Robotics AI-Driven Agricultural Modernization
- De janeiro de 2023 a maio de 2025, realizou capina em mais de 230 mil acres acumulados, evitando o uso de mais de 100 mil galões de glifosato (herbicida)
- Usa deep learning e visão computacional baseados em IA para eliminar ervas daninhas ao redor das plantações com laser
- Máquinas automatizadas conseguem cobrir 2 acres por hora e remover 200 mil ervas daninhas por dia
Halter AI-Driven Intelligent Grazing
- Em 2025, o número de novos contratos de coleiras inteligentes para pecuária crescia mais de 150% ao ano, em média
- O manejo de pastagem baseado em IA melhora a eficiência no uso de recursos, a saúde do solo e a sustentabilidade
- Comprova efeitos de grande escala em produtividade e redução de carbono capazes de superar a lenta adoção de tecnologia na agricultura moderna

Global Internet User Ramps Powered by AI from Get-Go = Growth We Have Not Seen Likes of Before

Com a expansão da internet via satélite de baixo custo, cresce rapidamente a possibilidade de que 2,6 bilhões de pessoas desconectadas, equivalentes a 32% da população mundial, passem a entrar online
Diferentemente das gerações anteriores, elas começarão sua primeira experiência de internet já com recursos de IA integrados por padrão
Em vez de digitar diretamente na barra de busca ou passar por navegadores tradicionais, a tendência é que obtenham informação e usem diversos serviços tecnológicos conversando diretamente com a IA em linguagem natural
Esse tipo de interface baseada em agentes de IA pode concentrar valor de mercado não nos apps, mas nos players que controlam a interface, abalando a hierarquia das plataformas existentes
Daqui para frente, possuir a interface será mais importante do que possuir a plataforma, e a IA capaz de entender idioma local, contexto e intenção do usuário tende a ser a principal vantagem competitiva

New Internet User Growth = Enabled by AI + Satellites

Orbital / Satellite Launch Market Share, Global = SpaceX Rising
- Desde 2008, com o início de um renascimento dos lançamentos espaciais comerciais e nacionais, a SpaceX passou a ocupar grande participação no número anual de lançamentos
- EUA (sem contar a SpaceX), China e Rússia também mostram crescimento, mas o avanço acelerado da SpaceX se destaca
- Da Guerra Fria até o fim dos anos 1990, o setor era liderado por governos; recentemente, cresce a tendência de lançamentos liderados pela iniciativa privada
SpaceX Starlink @ 5MM+ Subscribers = +202% Annual Growth Over 3.2 Years
- O Starlink aumentou sua base de assinantes de cerca de 100 mil em 2021 para mais de 5 milhões em 2024
- Registrou taxa de crescimento anual média de 202%, expandindo rapidamente sua base global de usuários de internet
SpaceX Starlink Ecosystem = Coverage Expanding Globally
- Em 2025, o Starlink expandiu sua área de serviço para América do Norte, América do Sul, Europa, Oceania, partes da África e principais regiões da Ásia
- Os países ainda sem serviço seguem sendo limitados, como China, Rússia e Irã
Starlink = Unlocking Previously-Inaccessible Internet Access in AI Era
- Coco, Monterrey, Mexico: fornece internet de alta velocidade e confiável em área rural do México, ampliando a acessibilidade digital por meio de Wi‑Fi comunitário
- Chile School District: fornece internet de alta velocidade capaz de conectar simultaneamente todos os 36 computadores de uma escola no Chile, transformando o ambiente de aula para alunos e professores
- Brightline Trains, USA: oferece internet via satélite estável em trens de alta velocidade nos EUA, melhorando a experiência dos passageiros e a eficiência operacional
- Seaspan Corporation, Global: introduziu internet via satélite em uma empresa global de transporte marítimo, permitindo transformar navios em escritórios remotos, melhorar a segurança da tripulação e a eficiência operacional, e viabilizar soluções antes impossíveis

AI & Work Evolution = Real + Rapid

Mudança fundamental na natureza do trabalho com a adoção de IA
- Junto com a automação física, como robôs e drones, a automação cognitiva também está se espalhando rapidamente
- Sistemas de IA estão ampliando seu campo de atuação no trabalho ao adquirir capacidades de raciocínio, criação e resolução de problemas
Velocidade de crescimento das capacidades cognitivas da IA
- Nos três anos desde o lançamento público do ChatGPT (novembro de 2022), evoluiu de um nível de ensino médio para capacidade de raciocínio em nível de doutorado
- Funções de regras e julgamento baseadas em grandes volumes de dados estruturados estão migrando para áreas em que a IA tem vantagem
Mudança na unidade do trabalho
- Há possibilidade de transição do trabalho tradicional centrado em humanos para um modelo centrado no poder computacional de data centers e modelos de IA
- Está chegando uma era em que a infraestrutura de IA determinará a oferta e a qualidade de determinadas forças de trabalho
Futuro baseado em agentes e o papel dos humanos
- Alguns projetam que agentes de IA substituirão empregos white-collar
- No entanto, é necessário considerar o padrão histórico em que, junto com ganhos de produtividade e eficiência, novos trabalhos humanos surgiram
- Mesmo em uma sociedade totalmente centrada em agentes, papéis humanos como supervisão, treinamento e orientação continuarão existindo
Estrutura futura do trabalho e mudanças sociais
- Como no RLHF (aprendizado por reforço com feedback humano), os humanos podem migrar para funções de treinamento e ajuste fino do desempenho de IA e robôs
- Historicamente, mudanças na forma de trabalhar sempre se repetiram, e a IA também é uma tecnologia que impulsiona a produtividade e a evolução do trabalho

Summary

Assim como é difícil imaginar a vida sem internet, também deve se tornar impossível imaginar um mundo sem IA no futuro
- A IA está se consolidando rapidamente como infraestrutura central em toda a indústria, incluindo atendimento ao cliente, desenvolvimento de software, ciência, educação e manufatura
Fatores que aceleram a popularização da IA
- A expansão global de ferramentas de IA multimodal como o ChatGPT, a queda no custo de raciocínio e o lançamento de diversos modelos estão impulsionando esse avanço
- De desenvolvedores solo a grandes empresas, o acesso e a experimentação ficaram mais fáceis, acelerando a disseminação da inovação
Infraestrutura tecnológica e investimento
- Grandes provedores de nuvem, semicondutores e hyperscalers estão registrando forte aumento no investimento em capital
- Em chips, data centers, redes e sistemas de energia, a fronteira entre o físico e o digital está ficando cada vez mais difusa
Competição estratégica entre EUA e China e liderança global em IA
- Os EUA lideram em inovação de modelos, chips customizados e infraestrutura de nuvem, mas a China também cresce rapidamente com open source, infraestrutura e apoio estatal
- Ambos os países veem a IA como alavanca central para o crescimento econômico e a influência geopolítica
Mudanças em plataformas e interfaces
- A IA está evoluindo além do ecossistema tradicional de apps para interfaces conversacionais baseadas em agentes
- Graças à internet via satélite e afins, é alta a chance de que novos usuários da internet no futuro comecem já com uma experiência nativa de IA
Mudanças nos empregos e na forma de trabalhar
- A adoção de IA no ambiente de trabalho está acelerando, com a unidade do trabalho migrando gradualmente de humanos para poder computacional e IA
- Cada vez mais pessoas trabalharão com IA, e a tendência de a IA reorganizar o ambiente de trabalho está ficando clara
Combinação entre cenário internacional e tecnologia
- O fluxo de informação e capital, a militarização da tecnologia e o aprofundamento do confronto entre democracia e autoritarismo elevam a incerteza
- Ainda assim, a inovação é vista como elemento central da competitividade nacional, com destaque para a importância de execução rápida e estratégia de alianças
Conclusão
- Chegou a hora do jogo da IA, e isso está ficando cada vez mais intenso
- O Genie (gênio) não voltará para a garrafa (já ultrapassamos um ponto sem volta)

1 comentários

xguru 2025-06-02

Também está disponível em arquivo PDF: https://www.bondcap.com/report/pdf/Trends_Artificial_Intelligence.pdf