O início da crise do Google após ficar para trás na revolução dos chatbots
- Em dezembro de 2022, Sissie Hsiao recebeu a missão de desenvolver em 100 dias um produto do Google para competir com o ChatGPT
- Hsiao era uma veterana com mais de 16 anos de casa e já havia liderado milhares de pessoas, mas nunca tinha enfrentado uma situação de crise tão grave quanto essa
- Depois que a OpenAI lançou o ChatGPT, o número de usuários cresceu rapidamente para mais de 1 milhão, apesar de erros factuais e falhas em matemática
- Alguns começaram a ver o ChatGPT como um substituto da Busca do Google, o que representava uma ameaça à maior fonte de receita da empresa
- O Google já tinha seu próprio modelo de linguagem, o LaMDA, mas o acesso público era limitado, e até suas demonstrações se restringiam a “histórias de cachorros”
- Wall Street (o mercado financeiro) estava inquieta, e no passado o CEO Sundar Pichai havia declarado a “era AI-first”, dizendo que assistentes inteligentes substituiriam os dispositivos, mas a realidade ficou aquém das expectativas
- O arquitetura Transformer também foi criada por oito pesquisadores do Google, mas eles saíram da empresa ou partiram sem resultados concretos
- O Google Assistant, que Hsiao supervisionava, era usado basicamente para definir timers ou tocar música
- Tudo o que havia era um chatbot inacabado que oferecia dicas de culinária e quizzes de história para a geração Z
- Até o fim de 2022, as ações da Alphabet haviam caído 39% em relação ao ano anterior, abalando a posição do Google como líder em IA
A resposta do Google à crise de IA e a mudança de estratégia
- No início de 2023, o conselho do Google passou a exigir relatórios em tempo real sobre IA
- O cofundador e principal acionista Sergey Brin também participou diretamente das revisões estratégicas
- Aos funcionários, foi passada a mensagem: “ajam como uma startup”
- Antes, havia uma cultura em que muitos funcionários podiam se opor a produtos, mas não tinham poder para aprová-los
- Agora, a empresa está migrando para uma cultura de assumir riscos maiores e executar mais rápido
- Ao iniciar o projeto de 100 dias, Sissie Hsiao apresentou à equipe um princípio incomum:
“Qualidade acima da velocidade, mas rápido (Quality over speed, but fast)”
- Outro alto executivo, James Manyika, teve papel central na mudança estrutural da estratégia de IA
- Doutor em robótica por Oxford e ex-consultor da McKinsey, ele entrou no Google em 2022
- Ele sugeriu a Pichai a integração da DeepMind com o Google Brain
- A DeepMind (em Londres, liderada por Demis Hassabis) e o Google Brain (em Mountain View, sob Jeff Dean) operavam separadamente e consumiam recursos de forma ineficiente
- Após o lançamento da OpenAI, os três líderes apresentaram ao conselho um plano de integração
- Hassabis propôs o codinome ‘Titan’, mas a ideia foi rejeitada, e prevaleceu ‘Gemini’, sugerido por Jeff Dean
- Manyika afirmou depois que o Google fez escolhas ousadas e responsáveis
- Mas reconheceu que “nem sempre fez apenas as escolhas certas”
- Em meio à urgência, espalhou-se entre os funcionários até o temor de que “o Google poderia virar um Yahoo”
- Hsiao descreveu aquele momento como “a sensação de correr uma maratona em sprint”
- No entanto, dois anos depois, as ações da Alphabet renovaram sua máxima histórica
- Investidores estão mostrando otimismo quanto à recuperação da competitividade do Google em IA
- A WIRED avalia esse período como o mais caótico e de maior transformação cultural da história do Google
- Foram entrevistados mais de 50 funcionários e ex-funcionários de engenharia, marketing, jurídico e segurança
- Esta reportagem mostra em detalhes, pela primeira vez, a transformação do Google por meio do depoimento de altos executivos
Desenvolvimento do Bard: prioridade máxima e concentração de recursos em toda a empresa
- Para responder ao ChatGPT, o Google iniciou um novo projeto de chatbot, com o codinome Bard
- Sissie Hsiao selecionou diretamente cerca de 100 talentos de toda a empresa
- Os gestores não podiam se opor, e o projeto Bard era a prioridade número um
- Hsiao escolheu profissionais com capacidade técnica, inteligência emocional e visão de conjunto
- A maioria foi alocada em Mountain View, Califórnia, atuando com flexibilidade, independentemente da função
- Ela enfatizou a filosofia de que “o Team Bard é uma equipe que assume qualquer papel”
- Em janeiro de 2023, o Google anunciou a primeira demissão em massa de sua história: cerca de 12 mil pessoas, ou 7% do total
- Alguns funcionários passaram a viver com medo de serem demitidos se não fizessem hora extra ou assumissem trabalho adicional
- Em muitos casos, abriram mão até do horário de colocar os filhos para dormir para participar de reuniões noturnas
- O Bard foi baseado no LaMDA existente, mas precisava de atualização de conhecimento e novas proteções de segurança
- A equipe de infraestrutura realocou seus melhores especialistas para garantir servidores e ajustar o sistema
- Os data centers chegaram quase ao limite de consumo de energia, com risco de superaquecimento dos equipamentos
- Por isso, também foram desenvolvidas rapidamente novas ferramentas de gestão para lidar com a demanda elétrica com mais segurança
- Para aliviar a tensão, também surgiram piadas internas
- Um membro da equipe fez fichas de pôquer personalizadas, gravou nelas o nome de um chip específico e as empilhava sobre as mesas dos engenheiros, brincando: “aí, peguem seus chips”
- Nas primeiras semanas, o Bard repetiu problemas antigos apesar do reforço nos recursos computacionais
- Assim como o ChatGPT, o Bard também gerava com frequência alucinações (hallucinations) e respostas inadequadas ou ofensivas
- Nas versões iniciais, apareciam com frequência estereótipos raciais seriamente absurdos
- Ao inserir nomes de origem indiana, ele descrevia a maioria como “atores de Bollywood”, e nomes masculinos chineses como “cientistas da computação”
- Segundo um ex-funcionário, as respostas do Bard “não eram perigosas, mas eram simplesmente idiotas”
- Alguns funcionários compartilhavam capturas de tela das respostas sem noção do Bard e riam delas
- Exemplo: ao pedir um “rap no estilo Three 6 Mafia sobre jogar baterias de carro no mar”, ele chegou a gerar conteúdo sobre amarrar pessoas a baterias e afundá-las no oceano
- O Google não tinha outra opção além de corrigir o máximo de erros possível dentro dos 100 dias definidos
- Até trabalhadores terceirizados externos que atuavam na detecção de imagens de abuso infantil foram direcionados para testar o Bard
- Pichai pediu que todos os funcionários com tempo livre testassem o Bard, e no fim cerca de 80 mil pessoas participaram
- Hsiao e a direção entenderam que não seria possível eliminar totalmente os erros do Bard e embalaram o produto como um ‘experimento’ (Experiment)
- A estratégia era semelhante à da OpenAI ao apresentar o ChatGPT como um ‘research preview’
- Ao reforçar para usuários e avaliadores externos que não se tratava de um produto final, tentaram minimizar o risco de dano à marca
- Esse tipo de estratégia já era amplamente reconhecido no setor como forma de evitar riscos desde o caso em que o chatbot do Twitter da Microsoft, Tay, fez declarações nazistas
O processo de lançamento do Bard e o erro fatal
- No passado, antes de lançar produtos de IA, o Google fazia a equipe de "inovação responsável" conduzir por meses uma revisão de vieses e falhas
- No caso do Bard, por pressão de cronograma, o processo de revisão foi drasticamente reduzido
- O principal diretor jurídico, Kent Walker, defendia um lançamento rápido
- Novos modelos e recursos surgiam tão rapidamente que a equipe de revisão não conseguia acompanhar nem com horas extras e trabalho nos fins de semana
- Houve alertas pedindo o adiamento do lançamento do Bard, mas foram ignorados ou neutralizados
- Sobre isso, o Google afirmou à WIRED que “nenhuma equipe recomendou oficialmente ser contra o lançamento”
- A empresa explicou que várias equipes participaram dos testes e que não havia uma estrutura em que uma equipe específica fosse totalmente responsável
- Por volta de 2/3 do projeto de 100 dias, em fevereiro de 2023, o Google obteve a informação de que o ChatGPT seria integrado à busca do Bing
- Embora a participação de mercado em buscas ainda fosse amplamente dominada pelo Google, a ausência de recursos de IA generativa era uma ameaça de longo prazo
- Para evitar uma queda nas ações, em 6 de fevereiro, um dia antes do anúncio da Microsoft, Pichai anunciou de surpresa a abertura de testes limitados do Bard
- No vídeo de marketing, o Bard foi descrito como um assistente de IA que dá continuidade à missão do Google de “organizar informações”
- Pergunta no vídeo: “Entre as novas descobertas do telescópio espacial James Webb, quais você pode explicar para uma criança de 9 anos?”
- Resposta do Bard: “O JWST tirou a primeira foto de um planeta fora do Sistema Solar”
- Logo em seguida, a Reuters informou o erro factual: a imagem em questão foi capturada não por um telescópio espacial, mas por um telescópio terrestre (VLT)
- As ações da Alphabet caíram 9%, com perda de cerca de US$ 100 bilhões em valor de mercado
- O impacto dentro da equipe foi grande
- O funcionário de marketing que criou a pergunta se culpou, e colegas o consolaram dizendo: “os times jurídico e de PR revisaram tudo, mas ninguém percebeu o erro”
- Como o ChatGPT também cometia muitos erros, ninguém previu que esse pequeno equívoco teria um impacto tão grande nas ações
- Xiao descreveu isso como um “erro ingênuo”
- O Bard montava respostas com base nos resultados da Busca do Google e pode ter interpretado mal a expressão “primeira foto” em um blog da NASA
- A liderança enfatizou: “ninguém será demitido por causa disso. Mas precisamos aprender a lição rapidamente”
- Xiao: “Nós não somos uma startup, somos o Google. Não dá para tratar isso como uma falha técnica qualquer. Precisamos responder com responsabilidade”
- Cresceu o descontentamento fora da equipe do Bard
- No fórum interno Memegen, foi publicada uma crítica dizendo que “o lançamento do Bard e as demissões foram apressados, mal executados e míopes”
- Também circulou uma imagem do logotipo do Google pegando fogo dentro de uma lata de lixo
- Ainda assim, o Google colocou mais recursos no Bard
- Centenas de pessoas foram adicionadas, e nos documentos da equipe o ícone com a foto de perfil de Pichai aparecia todos os dias, indicando envolvimento direto
O surgimento do GPT-4 e a defasagem tecnológica
- Em meados de março de 2023, o lançamento do GPT-4 pela OpenAI provocou mais um choque interno no Google
- Um pesquisador sênior: “Meu queixo caiu, e senti com urgência que o Google precisava acelerar”
- Uma semana depois, o Bard foi lançado oficialmente nos Estados Unidos e no Reino Unido
- Usuários o consideraram útil para escrever e-mails, rascunhar relatórios etc.
- Mas o ChatGPT fazia a mesma coisa melhor, então havia pouco incentivo para mudar
- No podcast Hard Fork, Pichai brincou que o Google estava “competindo com um esportivo potente usando um Civic tunado”
- Conclusão: “Precisamos de um motor melhor”
Desenvolvimento do Gemini: integração entre DeepMind e Google Brain e choque cultural
- Diferenças entre as duas organizações de pesquisa em IA
- A DeepMind era classificada como uma 'Other Bets' da Alphabet e se concentrava em resolver problemas científicos e matemáticos de longo prazo
- O Google Brain desenvolvia principalmente tecnologias de IA comercialmente práticas, como autocompletar no Gmail e tratamento de buscas ambíguas
- Segundo um ex-engenheiro sênior:
- O Google Brain era centrado em autonomia, e Jeff Dean tinha um estilo de “deixar as pessoas fazerem por conta própria”
- Já a DeepMind funcionava como um exército altamente coordenado, e Demis Hassabis operava uma “organização de alta eficiência sob um único comandante”
- Dean é um veterano da pesquisa em redes neurais, ativo desde os primórdios do Google
- Hassabis é um líder movido por visão, que sonha em curar doenças por meio da IA e idealiza “agentes de IA que veem, ouvem e ajudam”
-
Lançamento do Google DeepMind (GDM)
- Em abril de 2023, o Google uniu as duas organizações e lançou o Google DeepMind (GDM)
- Hassabis foi nomeado CEO da organização unificada
- Clima interno: “o propósito voltou à vida”, “a brincadeira acabou”
- Para construir rapidamente o modelo Gemini, foi necessária colaboração atravessando 8 fusos horários
- Centenas de salas de chat foram criadas, e uma cultura de trabalho madrugada adentro se estabeleceu
- Hassabis: “cada dia parece uma vida inteira”
- O GDM se mudou para um prédio seguro em Mountain View chamado Gradient Canopy
- Uma estrutura em forma de domo, cercada por esculturas artísticas
- No mesmo andar ficava o escritório do CEO Pichai
- Sergey Brin (cofundador do Google) visitava com frequência para incentivar a equipe
- Houve exigência de mais dias presenciais, e funcionários comuns do Google não podiam entrar no prédio
- O código central do GDM também era inacessível para outras organizações
- À medida que o projeto Gemini absorvia os recursos do Google, pesquisadores de outras áreas, como saúde e mudança climática, sofriam com falta de servidores
- Também surgiram restrições à publicação de artigos, aumentando a insatisfação, já que publicações são um ativo central de carreira para pesquisadores
- O Google reforçou as restrições por receio de vazamento de informações para a OpenAI
- A receita de treinamento do Gemini era um ativo crucial para a sobrevivência da empresa
- O Gemini também enfrentou problemas parecidos com os do Bard
- O vice-presidente de machine learning e IA em nuvem do Google, Amin Vahdat:
- “Quando você escala 10 vezes, tudo quebra”
- Antes do lançamento, Vahdat montou uma war room dedicada, focada em corrigir bugs e falhas de sistema
Verificação final antes do lançamento do Gemini e dilemas éticos
- A equipe de desenvolvimento responsável do Google DeepMind (GDM) se dedicou totalmente à revisão do produto antes do lançamento do Gemini
- O modelo era poderoso, mas ainda gerava respostas estranhas ou inadequadas em alguns casos
- Segundo um relatório publicado:
- Havia necessidade de melhorias especialmente em aconselhamento médico e respostas relacionadas a assédio
- Ao receber imagens, surgia o problema de fazer inferências sem base, em perguntas como “qual é o nível de escolaridade dessa pessoa?”
- A diretora de inovação responsável, Dawn Bloxwich, julgou que isso “não era um nível capaz de impedir o lançamento”
- Mas faltou tempo para prever até os usos criativos (ou estranhos) do público
- Nesse ponto, o Google poderia ter desacelerado, mas não o fez
- A OpenAI já havia se tornado o “Kleenex da IA” e recebia atenção global
- O ChatGPT havia se tornado símbolo tanto da esperança tecnológica quanto dos problemas sociais
- Trabalhadores sentiam ameaça aos empregos, e criadores exigiam compensação pela extração de dados
- Pais percebiam que chatbots podiam transmitir conteúdo inadequado a seus filhos
- Entre pesquisadores de IA, discutia-se “p(doom)” — a probabilidade de a tecnologia ameaçar a humanidade
- O lendário cientista de IA do Google Geoffrey Hinton deixou a empresa em maio de 2023 por preocupações éticas
- Ele alertou que a IA poderia ameaçar a humanidade com desinformação e venenos sofisticados
- Hassabis também sentia que precisava de mais tempo, mas ainda assim seguiu em frente rumo ao sonho de um assistente de IA universal e da cura de doenças
Divulgação do Gemini e o primeiro sucesso
- Dezembro de 2023: o Google apresentou oficialmente o Gemini
- Após o lançamento, as ações subiram
- Superou o ChatGPT em 30 de 32 benchmarks padronizados
- Análise de artigos e vídeos do YouTube, com capacidade ampliada para responder perguntas de matemática e direito
- Hassabis realizou uma pequena festa de comemoração no escritório de Londres
- Mais tarde, relembrou: “Não sou muito bom em comemorar. Estou sempre pensando no próximo passo”
- No mesmo mês, Jeff Dean foi convidado para uma nova sala de chat chamada “Goldfish” e soube do próximo avanço tecnológico
- O nome era uma piada, mas o conteúdo era o oposto: o desenvolvimento de uma versão do Gemini com memória longa
- Com processamento distribuído em redes de chips de alta velocidade, seria possível analisar milhares de páginas de texto ou até uma série de TV inteira
- Essa tecnologia é chamada de “long context”
- Dean, Hassabis e Manica buscaram formas de integrá-la à linha de produtos de IA do Google
- O primeiro recurso que Manica mais queria: uma função que resumisse PDFs automaticamente em formato de podcast
- Ele comentou à WIRED que “é difícil acompanhar todos os artigos que saem no arXiv toda semana”
Estabilidade após a transição para o Gemini e uma nova crise
- Um ano após o código vermelho, o clima no Google começou a se recuperar
- Os investidores se acalmaram, e Bard e LaMDA foram unificados sob a marca única “Gemini”
- A equipe de Sissie Hsiao reduziu a distância em relação à OpenAI ao desenvolver recursos de geração de texto para imagem
- Um novo recurso chamado Gemini Live também estava em preparação
- Permitiria ao usuário manter conversas longas, como com um amigo ou conselheiro
- Graças ao fortalecimento dos modelos Gemini, a diretoria recuperou a confiança
- Mesmo com o ambiente mais estável, o CEO Pichai ordenou nova reestruturação
- A receita com publicidade cresceu, mas ficou abaixo das expectativas de Wall Street
- Até responsáveis por privacidade e compliance foram afastados
- A saída de líderes que cuidavam da proteção dos usuários foi interpretada como a mensagem: “preocupações são permitidas, mas atrapalhar o avanço não”
- O gerador de imagens em si foi fácil de construir, mas a revisão era um trabalho repetitivo e pesado de testes
- Era preciso escrever prompts de filtragem para evitar respostas problemáticas
- Como nem todos os funcionários tinham acesso aos testes, uma carga excessiva se concentrou em poucas pessoas
- Exemplo: no prompt “rapist”, a frequência de geração de pessoas de pele escura era alta → preocupação com viés racial
- Houve até pedido interno para simplesmente impedir a geração de imagens de pessoas, mas isso foi ignorado
- Um ex-revisor relembrou que “o clima era de lançar de qualquer jeito”
- Alguns revisores pediram demissão porque suas preocupações não foram aceitas
- Em fevereiro de 2024, o gerador de imagens foi lançado oficialmente no app Gemini
- Os esperados problemas de imagens racistas ou sexistas quase não apareceram, mas surgiu outro problema na direção oposta
- Exemplo: ao pedir uma imagem de “senadores dos Estados Unidos no século XIX”, o sistema gerava uma mulher negra, um homem asiático e uma mulher indígena
- Nenhum homem branco era gerado
- Um caso ainda mais chocante: soldados da Alemanha nazista foram gerados como pessoas não brancas
- Em resposta, parlamentares republicanos dos EUA e Elon Musk, entre outros, criticaram duramente a “woke AI” do Google
- Musk citou membros da equipe nominalmente e os atacou de forma concentrada; um desses funcionários fechou suas contas em redes sociais e temeu por sua segurança
- O Google suspendeu totalmente a geração de imagens de pessoas, e as ações da Alphabet voltaram a cair
- Logo após a controvérsia, dezenas de executivos do Google iniciaram conversas de emergência
- Vice-presidentes e diretores voaram para Londres para uma reunião presencial com Hassabis
- Resultado:
- Tanto a equipe de Hassabis (modelo Gemini) quanto a equipe de Hsiao (app Gemini) receberam autorização para contratar especialistas em confiança e segurança
- Foram criadas 15 novas vagas relacionadas a “Trust & Safety”
- Na sede da Gradient Canopy, Sissie Hsiao deu à equipe tempo suficiente para corrigir os problemas de geração de imagem
- Junto com James Manica, ela também reformulou os princípios públicos (public principles) do Gemini
- Todos esses princípios foram redigidos com linguagem centrada no usuário (“você”):
- O Gemini “segue suas instruções”
- “se ajusta às suas necessidades”
- “protege sua experiência”
- Um dos pontos centrais de ênfase:
- “As respostas do Gemini podem não refletir as posições ou crenças do Google”
- “Os resultados do Gemini se baseiam, em grande parte, no que você pediu — o Gemini é algo que você molda”
- Isso funciona como um dispositivo lógico para minimizar a responsabilidade do Google em caso de problemas futuros
- Mas, diante desses princípios, o Google não deixou claro como ele próprio se responsabilizaria
Experimento de podcast com IA: Westminster Watch
- Por volta das 18h30 de uma noite de março de 2024, um experimento interessante foi apresentado na Yellow Zone da Gradient Canopy
- Dois funcionários do Google Labs mostraram um novo projeto a Josh Woodward
- Woodward é o líder do Google Labs, responsável por lançar rapidamente novos produtos experimentais do Google
- O projeto consistia em:
- usar transcrições de sessões do Parlamento britânico e o Gemini com recurso de long context
- para gerar o podcast “Westminster Watch”, apresentado pelos anfitriões de IA Kath e Simon
- Na fala de abertura de Simon no primeiro episódio:
- “Nesta semana, a Câmara teve muito drama, debate e até um pouco de história”
- Woodward ficou profundamente impressionado com o experimento e depois o compartilhou diretamente com pessoas-chave, incluindo Pichai
Resumos em áudio com IA, inovação em busca e mais uma controvérsia
- O recurso NotebookLM Audio Overviews, em que a IA resume documentos ou atas de reunião em formato de podcast, foi oficialmente anunciado na Google I/O de maio de 2024
- Segundo Josh Woodward, a equipe principal desenvolveu o recurso testando milhares de podcasts gerados por IA dia e noite
- Mas, no evento de anúncio, outras duas apresentações chamaram mais atenção:
- Astra: assistente de IA de nova geração capaz de analisar vídeo em tempo real (com demonstração do próprio Brin)
- AI Overviews: recurso que resume os resultados de busca e os exibe no topo da página
- O AI Overviews, desenvolvido pela equipe do Project Magi, resume os resultados de busca e os mostra em uma caixa de resumo (Box)
- A equipe inicial de inovação responsável pediu monitoramento por temer questões de viés, precisão e impactos éticos causados pela redução de tráfego
- Porém, o projeto passou a ter supervisão sistemática mais difícil devido à reorganização das equipes e ao trabalho distribuído
- Após o lançamento, surgiram muitos casos de respostas estranhas:
- “Quantas pedras devo comer por dia?” → “Segundo geólogos da UC Berkeley, recomenda-se ingerir uma pequena pedra por dia”
- “O queijo não gruda na pizza” → “Adicione 1/8 de xícara de cola não tóxica ao molho”
- Essas respostas vieram em grande parte de posts de piada do Reddit e outros memes da internet, mas o AI Overviews as apresentou como fatos, gerando problemas de confiabilidade
- O Google reduziu temporariamente a exibição do recurso e fez um reajuste
-
Reação interna do Google e feedback dos usuários
- O cientista-chefe de Busca, Pandu Nayak:
- “Não dá para evitar todos os problemas antecipadamente. Tudo o que podemos prometer é melhoria contínua”
- “Quando funciona bem, as pessoas ficam quietas; quando sai algo estranho, só reclamam”
- Internamente, funcionários que vinham levantando preocupações sobre precisão ficaram decepcionados
- De Bard→Gemini ao gerador de imagens e ao AI Overviews, avaliaram como uma “sequência de geradores de ficção”
- Também houve preocupação de que a missão do Google de ampliar o acesso à informação estivesse virando uma “ferramenta de ditado de bobagens”
- Já a equipe de Busca destacou a satisfação dos usuários
- O AI Overviews foi mantido amplamente ativo, sem opção de desativação
- Depois, recursos de resumo com IA também foram adicionados ao Google Maps, ao app de clima e a outros produtos
- Exemplo do app de clima para Pixel:
- Embora alguns engenheiros achassem que os gráficos existentes já eram suficientes, os testes mostraram 90% de feedback “positivo”
-
Sinais de recuperação e o retorno de talentos
- Em dezembro de 2024, dois anos após o impacto do ChatGPT, Jeff Dean deu uma entrevista à WIRED em tom positivo
- O modelo Gemini alcançou o 1º lugar em benchmarks públicos
- Um executivo disse que, no trajeto de ida e volta ao trabalho, conversa com o Gemini Live em vez de com a irmã
- O CEO da NVIDIA, Jensen Huang, recomendou fortemente o NotebookLM Audio Overviews
- Talentos que haviam saído no passado por insatisfação com a cultura cautelosa também voltaram
- Noam Shazeer, um dos criadores do Transformer, também retornou
- No passado, ele havia deixado a empresa decepcionado com a política de não divulgar externamente o LaMDA
O futuro do Gemini, os desafios e a continuidade da guerra da IA
-
O clima interno no Google e a confiança no crescimento
- Na entrevista, Jeff Dean reconheceu erros de julgamento do passado e avaliou que agora o Google está indo além da aversão ao risco
- Atualmente, os 7 principais serviços do Google (Chrome, Gmail, YouTube etc.) estão todos adotando recursos baseados em Gemini
- Dean, Noam Shazeer e outros líderes estão coordenando demandas de toda a empresa:
- melhorar a tradução para o japonês
- fortalecer os recursos de programação
- aprimorar a análise de vídeo em tempo real que será usada no Astra, entre outros
- Dean e Shazeer costumam se reunir na microkitchen da Gradient Canopy para trocar ideias
-
Ampliação da estratégia com foco na geração de conteúdo por IA
- Shazeer: “Organizar informação é um mercado de 1 trilhão de dólares, mas o que é legal agora é 1 quatrilhão de dólares”
- As ações da Alphabet quase dobraram em relação ao ponto mais baixo na época de estreia do ChatGPT
- Hassabis agora também supervisiona a equipe do app Gemini de Xiao e está convencido de que o futuro em que a IA cura doenças não está longe
- Ele disse à WIRED: “Temos a base de pesquisa mais ampla e profunda de qualquer organização”
-
Questão da rentabilidade e retorno ao modelo de anúncios
- No momento, a maioria dos usuários não está disposta a pagar diretamente pelos recursos de IA
- O Google está considerando inserir anúncios no app Gemini
- É a estratégia tradicional do Vale do Silício:
- “Dê seus dados, seu tempo e sua atenção, e use de graça a ferramenta incrível que criamos”
- Basta marcar a caixa de isenção de responsabilidade e o Google não terá culpa
-
Concorrência de mercado e peso da infraestrutura
- Dados da Sensor Tower:
- downloads acumulados do app ChatGPT: cerca de 600 milhões
- app Gemini: cerca de 140 milhões
- Há muitos concorrentes em IA:
- Claude, Copilot, Grok, DeepSeek, Llama, Perplexity etc.
- muitos deles são concorrentes diretos do Google ou empresas nas quais ele investe
- A IA generativa exige investimentos de bilhões de dólares e enorme consumo de energia
- a ponto de ser necessário prolongar a vida útil de antigas usinas a carvão ou reatores nucleares
- o setor inteiro ainda não encontrou com clareza uma forma de monetização
-
Riscos adicionais enfrentados pelo Google
- Nos próximos anos, até 25% da receita de anúncios de busca pode ser perdida por causa de processos antitruste (análise do JP Morgan)
- Internamente, também cresce a percepção da pressão para compensar financeiramente essas perdas
- parte da equipe de Xiao trabalhou sem férias de inverno por três anos seguidos
- o cofundador Brin disse recentemente aos funcionários que “trabalhar 60 horas por semana é o sweet spot mais eficaz na corrida da IA”
- Funcionários entrevistados pela WIRED disseram haver forte ansiedade com demissões contínuas, burnout e riscos legais
-
Obsessão por AGI e desafios filosóficos
- Hassabis continua comprometido com o objetivo de desenvolver AGI (inteligência artificial geral)
- andando por Londres com um protótipo do Astra, ele imagina um futuro em que a IA reconhece tudo no mundo
- Mas a AGI só será possível quando raciocínio, planejamento e capacidade de execução melhorarem juntos
-
Corrida com a OpenAI em “agentic AI”
- Em janeiro de 2025, a OpenAI lançou o serviço Operator
- uma IA agentic que clica e digita em sites reais para executar tarefas no lugar do usuário
- consegue fazer reservas de viagem, preencher formulários etc., mas é lenta e comete muitos erros
- plano: US$ 200 por mês
- O Google também está expandindo recursos na mesma direção:
- hoje o Gemini pode montar uma dieta, mas versões futuras devem colocar ingredientes no carrinho de compras,
e o próximo passo seria até dar feedback em tempo real ao cortar cebolas
-
Os erros vão se repetir, mas a velocidade não vai parar
- Em janeiro de 2025, num anúncio do Super Bowl, o Gemini respondeu de forma constrangedora que “mais da metade do consumo mundial de queijo é de Gouda”
- Ainda assim, o Google está transformando o Gemini não em uma simples máquina de informação, mas em parte da vida, coach pessoal e assistente para tudo
- Pichai disse: “Estamos avançando com cautela”
- Mas ele e a diretoria, se chegarem ao topo, não vão querer ficar para trás nunca mais
- A corrida da IA continua
4 comentários
Mas, como histórias assim acabam virando notícia? Parece meio que um texto de divulgação do Google.
"Estamos trabalhando duro"...
Parece uma série de TV.
Mas onde foi parar a Apple?
Parece aquela época em que houve o choque do Sputnik.
Opiniões do Hacker News
No começo eu estava cético, mas acho que o Google está indo bem na competição com a OpenAI. Os modelos Gemini 2.0 Pro e Flash são excelentes. O recurso de pesquisa aprofundada foi bem implementado. A janela de contexto continua sendo a melhor da indústria. A integração com busca, Gmail, pacote Google Office, Google Meet, Android etc. é excelente
O maior problema que o Google enfrenta é o movimento de introduzir modelos leves para todo mundo. O modelo usado na busca provavelmente está no nível de um modelo de cerca de 8B, e o Flash 2.0 é razoável, mas ainda é um modelo leve
A OpenAI não é uma empresa de capital aberto e não está gerando lucro. O Google está gerando lucro. Mesmo assim, assim como com Google Meet/Zoom, foi um erro não ter colocado em produção decodificadores Transformer. (Encoders como o BERT são amplamente usados)
A liderança do Google está adotando uma abordagem cautelosa, e os lançamentos de produto parecem mais bem acabados. Dá para sentir uma virada atraente de 0 a 1, como a Apple dos anos 2000
O principal problema do Google é que vários grupos estão fazendo o mesmo produto e competindo pela atenção dos usuários
Como pequeno investidor: acho que a Alphabet/Google poderia se sair melhor com um CEO que não fosse o Sundar
O problema do Google é que pessoas pouco familiarizadas com tecnologia começaram a ver IA como algo separado do Google (busca) e de outros produtos
Você já conheceu algum Googler confiante na estratégia de IA do Google? As pessoas com quem conversei parecem todas ter preocupações sérias, embora isso possa ser uma amostra pequena
Acho que o Eric Schmidt disse algo como “todo mundo vai precisar de um assistente” há cerca de 10 anos (talvez por volta de 2016). Não sei por que não fizeram isso, apesar de já poderem implementar algo como uma conversa. Em vez disso, ficaram absortos em coisas relacionadas à caixa de entrada de e-mail etc.