Google declara guerra à web
(tante.cc)- Google Search está saindo do modelo que enviava usuários para links e migrando para respostas processadas, criando uma nova camada controlável sobre a web
- Há análises indicando que AI Overviews dá respostas erradas em cerca de 10% dos casos, e o Search está abrindo mão em grande parte de fornecer links para as fontes de informação
- Por trás do verniz de “AI” e “agentic”, o núcleo é descontextualizar a informação, remover a fonte e substituí-la por respostas de LLM
- Sites e criações se tornam menos produtos culturais compartilhados e mais matéria-prima não remunerada para a extrusora de texto sintético do Google
- As respostas passam por de-googlificar sua vida digital, evitar o Chrome e usar mecanismos de busca alternativos; caso contrário, você pode acabar vendo apenas o que o Google considerar relevante
A nova camada de abstração que o Google Search está criando sobre a web
- A keynote do Google I/O pode ser lida como um ataque ao que resta da web, e a explicação do Google mostra uma direção em que o Search empurra ainda mais para respostas processadas em vez de fornecer links
- Atualmente, os snippets de IA do Search, AI Overviews, têm análises apontando respostas erradas em cerca de 10% dos casos, e o Google está abandonando em grande parte o paradigma antigo de fornecer links para as fontes de informação
- Por trás de rótulos como “AI” e “agentic”, o essencial é descontextualizar a informação, remover links para a fonte e então entregar respostas geradas por LLM
- Em vez de tratar sites e criações como algo para o usuário visitar e compartilhar diretamente, o Google está criando uma nova camada de abstração controlável sobre a web, escondendo tudo atrás da superfície do Google
Criações deixam de ser produtos culturais e viram matéria-prima
- Sites, textos e arte ainda importam em algum grau, mas seu valor se aproxima mais do de matéria-prima não remunerada para a extrusora de texto sintético do Google
- Criadores trabalham de graça, o Google controla com mais força o fluxo de informação e pode moldar as respostas que as pessoas recebem na direção que desejar
- Criações deixam de ser produtos culturais importantes que podem ser compartilhados com outras pessoas e passam a ser tratadas como insumos para o Google processar e recombinar
Uma mudança contra a web participativa
- Essa mudança não é definida como uma revolução em direção à web participativa, mas como uma contrarrevolução contra a web participativa e contra os próprios usuários
- O objetivo é tomar a web e conduzir as pessoas para uma camada de abstração sobre ela, controlada e ajustada pelo Google
- Isso é descrito como um problema de monopólio do acesso à informação e como o verdadeiro Metaverse, distante de padrões abertos e da capacidade de cada pessoa criar um canto da web de acordo com suas necessidades e desejos
- Como a influência do Google sobre os padrões da web é forte, essa direção pode mudar até a forma padrão do terreno técnico sobre o qual a web é construída
O potencial de controle em nome de uma “web segura”
- Na próxima etapa, o Google ou outras empresas do mesmo setor podem criar e disseminar um novo termo pejorativo para rotular a web tradicional como suja, descontrolada, perigosa e ruim
- Esse tipo de nomeação funcionaria de forma parecida com “Dark Web”, ajudando a posicionar a superfície abstraída do Google como a web segura
Resposta: reduzir a dependência do Google
- Se você valoriza a web e a capacidade de as pessoas participarem dela, em vez de serem apenas consumidores passivos, essa mudança precisa ser levada a sério
- Torna-se mais urgente de-googlificar sua estrutura mental e digital
- Sugere-se buscar outros mecanismos de busca e optar por não usar o navegador Chrome
- Caso contrário, você pode acordar em um ambiente parecido com uma AOL tomada por slop, onde o acesso à informação fica limitado ao que a extrusora de texto sintético do Google considerar relevante
1 comentários
Opiniões do Hacker News
Parece que a IA já chegou ao ponto de “arte, código, música e escrita: se quiser fazer por satisfação pessoal, tudo bem, mas ganhar dinheiro com isso, não dá mais”
Ganhar dinheiro com conteúdo parece algo possível só para grandes empresas, e, se você publica qualquer criação, no fim ela só volta a ser dada de comer para as máquinas e segue sendo copiada sem parar
Parece que o mundo está quase se separando em duas “sociedades”: a que gosta de IA + grandes empresas + inovação e destruição muito rápidas, e a que prefere trabalho artesanal + pequenos negócios + inovação mais lenta, mas mais sustentável
Pessoalmente, eu gostaria de viver na segunda sociedade, mas acho que as duas podem continuar existindo e evoluindo à sua maneira
Claro, sociedades diferentes inevitavelmente acabam interagindo e influenciando umas às outras
Vi um efeito parecido no setor hoteleiro. Hotéis, booking.com e Google todos querem ganhar dinheiro, mas o cliente normalmente pesquisa no Google por “hotel em algum lugar”, e o Google vende anúncios para essa busca, fazendo com que quem oferece mais acabe ficando com a maior parte do lucro
É preciso taxar os lucros excessivos das empresas de tecnologia obtidos a partir do esforço dos outros, e usar esse dinheiro para apoiar artistas vivos
Lembra vagamente a taxa que antigamente era cobrada sobre fitas cassete virgens para compensar a pirataria. Só que o dinheiro deveria ir direto para os artistas de verdade, não para gravadoras ou editoras
Para esse tipo de “cliente”, não seria muito diferente de emoldurar e pendurar um pôster da Mona Lisa
Em vez de ameaçar os artistas, a IA pode acabar tornando obras originais ainda mais valiosas e prazerosas
Para tentar impedir isso, há um ou dois meses coloquei a maior parte do meu site de pesquisa sobre Amazon Redshift atrás de autenticação básica com usuário/senha
Continua tudo gratuito, mas para receber usuário e senha é preciso me mandar um e-mail
Passei tempo produzindo esse conteúdo; se empresas como OpenAI o copiam, vendem isso via LLM, e como resultado ninguém mais visita meu site, então eu deixo de ter motivo para criar esse conteúdo. Aí não sobra nada para a OpenAI pegar, nem para outras pessoas lerem, e todo mundo perde
Isso é parasitário e, à primeira vista, parece matar o hospedeiro. Na prática, parece quase uma abolição do conceito de propriedade privada
As empresas de IA podem pegar o que eu criei sem meu consentimento e vender isso com lucro, e esse lucro parece vir em boa parte da recompensa que antes cabia a mim pelo meu esforço
Procurei uma forma de sinalizar para as empresas de IA que removam meu conteúdo, mas os mecanismos oferecidos são só dispositivos nominais que jogam o ônus para cima de mim. E ainda não dá para saber se foi realmente removido. É algo como: “se você mostrar por meio de um prompt que seu conteúdo aparece, tentaremos tomar medidas para que ele deixe de aparecer”
Como resultado de ter colocado a barreira de usuário/senha, o Google derrubou bastante o ranking do site, e agora considero que ele está praticamente impossível de encontrar nas buscas
Também fico me perguntando se sinalizar às empresas de IA que não quero meu conteúdo inclui até serviços que ao menos fornecem atribuição e links para a fonte original. O Perplexity, por exemplo, faz isso relativamente bem
Se você bloqueia o acesso ao conteúdo sem login, então também está bloqueando a indexação por mecanismos de busca, então é natural que o Google rebaixe seu ranking
Fico um pouco confuso sobre qual é o objetivo final. Quando você publica conteúdo gratuito na web, não sei exatamente o que se ganha ao bloquear a indexação por IA, especialmente se, junto com a IA, você também está bloqueando usuários reais e a busca tradicional
Entendo a frustração de ver ferramentas de IA digerirem seu conteúdo e depois repetirem isso ao usuário sem ligar de volta ao seu site. Mas, independentemente de IA, as pessoas sempre fizeram algo parecido. Liam um texto, aprendiam fatos ou entendiam uma nova ideia e depois incorporavam isso ao próprio trabalho sem necessariamente reconhecer ou sequer lembrar da fonte daquela informação
A IA acelerou esse processo e o tornou mais visível, então entendo a frustração, mas talvez nunca tenha sido razoável esperar que tudo o que acontece a jusante do meu trabalho continue sempre atribuído a mim
Como você disse, eles sabem que precisam de dados bons, então talvez de fato tentem encontrar algum ponto de equilíbrio
Caso contrário, os laboratórios de IA podem acabar produzindo internamente o novo conteúdo valioso para alimentar os LLMs. Parece loucura, mas a Netflix também produz conteúdo próprio
Os laboratórios de IA parecem grandes demais e provavelmente vão assumir papéis além de simplesmente oferecer inferência de LLM. Eles podem se tornar tão poderosos quanto muitos governos nacionais atuais, ou até mais
É difícil entender qual é o estágio final disso tudo. Os sites deixavam o Google rastrear seu conteúdo em troca de receber tráfego
Se o Google cortar isso completamente, não vejo que incentivo sobra para que os sites não bloqueiem o crawler do Google
Entendo sentir uma ameaça existencial em outros produtos de IA do Google que respondem diretamente, mas ele também precisa entender a relação simbiótica com a web
Por que comprar em um site aleatório, se o Gemini pode comprar por você? Para que ir à Wikipedia buscar informação... você entendeu
Os próximos anos parecem decisivos para a web. O Facebook tentou uma estratégia parecida quando os apps ganharam força, mas no fim fracassou. Espero que o Google também fracasse
Se os sites deixarem de publicar ou de serem rastreados, de que as máquinas vão continuar se alimentando para funcionar?
Então, na cabeça deles, nada muda; o leitor só deixou de ser humano e passou a ser bot. Para quem escreve, isso é horrível
Há muito tempo deixamos o Google encarregado de enviar tráfego para os sites
Em grande parte porque o Google fez isso tão bem que as alternativas ficaram muito menos úteis
Agora que o Google está focado, por assim dizer, em ser “autocontido”, precisamos encontrar uma forma melhor de enviar tráfego aos sites. Idealmente, uma forma que não esteja sob o controle de uma única empresa
Mais alguém com saudade do StumbleUpon?
Entendo que provavelmente isso decorre da própria natureza do problema, mas antigamente surgiam um monte de ideias descentralizadas absurdamente inadequadas, então chama a atenção
Sites com coleções bem organizadas de links são muito mais úteis para descobrir novos sites
Como operador de site, vi o número de visualizações aumentar bastante, mas é realmente devastador ver um resumo de IA errado com meu site citado como fonte
Esse movimento de empurrar IA para tudo parece que no fim vai reduzir o nível de habilidade do mundo, e isso me preocupa porque não vejo como impedir
Hoje perguntei a um desenvolvedor como nosso produto está programado para lidar com determinada situação, e ele só me enviou o resumo do assistente interno de IA que começou a usar agora
Antes ele dava respostas realmente boas e bem pensadas; agora é só copiar e colar resposta de IA
Mas parece que eles são contra quando são eles que estão sendo raspados: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...
Se a web não já estivesse tão apodrecida desde o início, eu acharia isso mais triste
Em média, qualquer site em que você entra só quer te jogar anúncios e te importunar para assinar algo
Não entendo por que isso não é considerado pop-up
A estrutura de incentivos dos mecanismos de busca favorece conteúdo recente em vez de conteúdo bom, então todos os sites ficam despejando coisas que parecem lixo gerado continuamente
Hoje em dia, se o resultado da busca traz um carimbo de data dos últimos 2 anos, eu parto do princípio de que é lixo e nem clico
Talvez a resposta seja migrar para o Kagi. Lá eu sou cliente, não produto
Honestamente, nem todos os sites são assim, e ainda existem lugares bons. Mas os mecanismos de busca nunca te levam até eles. Só mostram porcaria o dia inteiro
Mesmo que alguém pudesse ter feito isso no lugar dele, quem de fato fez foi o Google, e ele contaminou o poço de onde todos nós bebemos
Quando cheguei mais ou menos no meio do texto, havia três anúncios enormes ocupando a parte de cima, a direita e a de baixo, consumindo mais espaço do que o próprio conteúdo, e no canto inferior direito ainda flutuava um anúncio em vídeo com reprodução automática cobrindo boa parte de um dos banners
O anúncio “dinâmico” no meio do texto ficava crescendo e encolhendo de repente, travando tudo, a ponto de eu realmente não conseguir ler nada
E isso já é uma das experiências relativamente melhores ao tentar ler esses blogs modernos ou coisas parecidas. Está chegando perto do nível de sites pornôs suspeitos
É triste e patético
Muitas vezes esse tipo de declaração não faz muito sentido para mim, porque não bate com o modelo de problema que eu enxergo
Eu sou alguém que escreve blog, ou, no jargão atual, um “produtor de conteúdo”, mas também sou usuário
Como usuário, eu quero que o agente de usuário do meu navegador exiba páginas da web para mim, e quero que um agente de busca extraia informações de várias fontes e as sintetize com a devida atribuição
Dá para rebater dizendo que talvez eu seja indiferente à intermediação por plataformas porque minha produção de conteúdo é hobby. Isso é verdade até certo ponto. Se eu dependesse disso para viver, talvez concluísse que prejudicar meu sustento é uma guerra contra a “web”
Só que, para um observador neutro, mesmo que isso seja uma guerra, ela seria uma guerra contra a minha forma de participar da web por meio da criação de conteúdo com fins de receita, reputação e recompensa
Como usuário, no fundo eu não me importo muito com cada site ou criador individual. A informação contida neles é útil, mas a heterogeneidade dos sites em geral é um obstáculo ao acesso à informação
Se agentes de busca e resumo conseguissem sintetizar com precisão o que esses sites dizem e tornar meu modelo da realidade mais preciso, eu ficaria muito mais satisfeito
Então eu posso ser convencido pelo argumento de que as mudanças do Google reduzem a chance de conteúdo correto ser criado e fazem com que eu seja enganado com mais frequência. Mas isso é uma ferramenta, e meu modelo de mundo será testado pela realidade com frequência
Se a máquina de busca e síntese não produzir resultados úteis, eu vou perceber e vou ajustar a forma como trato esse conhecimento para evitar consequências fatais. Mas isso já é assim hoje
Eu não tenho como saber se os resultados do Google não são resultados plantados e ajustados para mudar minha opinião, nem se o Google não está em conluio com o Internet Archive para fabricar um consenso com aparência de verdade
Como usuário, eu já preciso tomar muitas decisões, e ler resultados de busca penosamente para sintetizar por conta própria é muito menos útil do que usar agentes
Então, se existe uma guerra contra a web, eu participo dela com prazer. Do lado contra a web
É como um resumo de enredo ajudar você a decidir se quer ver um filme, sem ser substituto de assistir ao filme de fato
Para buscas como “50 usd in eur” ou “current weather in Paris”, tudo bem a IA responder. Para algo mais complexo do que isso, prefiro muito mais receber links para as fontes reais
A parte otimista é que isso parece empurrar ainda mais na direção para a qual a “web” já vinha há muito tempo: uma direção que atrapalha o usuário a obter a informação correta de forma honesta e eficiente, preservando seu orçamento de atenção e seu poder de escolha
Até agora, isso acontecia aumentando o ruído por incentivo financeiro; agora acontece cortando o ruído por incentivo financeiro
O motivo para algum otimismo é que, até aqui, não havia um inimigo único, então era difícil lutar contra um sistema meio disperso, mas agora o Google, ao piorar ainda mais a situação, está tornando a si mesmo e algumas poucas outras empresas alvos bem claros
Espero que isso faça mais gente ultrapassar o limite da paciência e tentar voltar para a “velha web”, de antes de Google e redes de anúncios a terem transformado, ou então encontrar novas formas de acessar livremente uns aos outros e ao conteúdo
Não será uma luta pequena nem fácil. Em grande parte, é uma luta contra o estado atual do capitalismo e para recuperar nossa atenção, nosso pensamento crítico e nosso poder de escolha
Eles deveriam pagar aos donos de sites pelos dados que usam
Agora eu já nem sei se isso é uma coisa ruim
A web está tão inundada de lixo de SEO que talvez seja necessário o Google ir embora e acontecer uma depuração ao estilo Usenet
Os recursos de IA normalmente já me dizem o que eu quero saber, e, se eu quiser verificar os fatos, em geral eles também colocam links para as fontes. O jeito tradicional baseado em links também funciona
Quem diz que ficou inutilizável geralmente não consegue dar exemplos concretos do que realmente não conseguiu encontrar
Eu também já vi algumas áreas fracas. Material antigo e obscuro parece ser um limite da maioria dos buscadores, e para material relacionado à pirataria dá para usar o Yandex