1 pontos por GN⁺ 2 시간 전 | 1 comentários | Compartilhar no WhatsApp
  • Google Search está saindo do modelo que enviava usuários para links e migrando para respostas processadas, criando uma nova camada controlável sobre a web
  • Há análises indicando que AI Overviews dá respostas erradas em cerca de 10% dos casos, e o Search está abrindo mão em grande parte de fornecer links para as fontes de informação
  • Por trás do verniz de “AI” e “agentic”, o núcleo é descontextualizar a informação, remover a fonte e substituí-la por respostas de LLM
  • Sites e criações se tornam menos produtos culturais compartilhados e mais matéria-prima não remunerada para a extrusora de texto sintético do Google
  • As respostas passam por de-googlificar sua vida digital, evitar o Chrome e usar mecanismos de busca alternativos; caso contrário, você pode acabar vendo apenas o que o Google considerar relevante

A nova camada de abstração que o Google Search está criando sobre a web

  • A keynote do Google I/O pode ser lida como um ataque ao que resta da web, e a explicação do Google mostra uma direção em que o Search empurra ainda mais para respostas processadas em vez de fornecer links
  • Atualmente, os snippets de IA do Search, AI Overviews, têm análises apontando respostas erradas em cerca de 10% dos casos, e o Google está abandonando em grande parte o paradigma antigo de fornecer links para as fontes de informação
  • Por trás de rótulos como “AI” e “agentic”, o essencial é descontextualizar a informação, remover links para a fonte e então entregar respostas geradas por LLM
  • Em vez de tratar sites e criações como algo para o usuário visitar e compartilhar diretamente, o Google está criando uma nova camada de abstração controlável sobre a web, escondendo tudo atrás da superfície do Google

Criações deixam de ser produtos culturais e viram matéria-prima

  • Sites, textos e arte ainda importam em algum grau, mas seu valor se aproxima mais do de matéria-prima não remunerada para a extrusora de texto sintético do Google
  • Criadores trabalham de graça, o Google controla com mais força o fluxo de informação e pode moldar as respostas que as pessoas recebem na direção que desejar
  • Criações deixam de ser produtos culturais importantes que podem ser compartilhados com outras pessoas e passam a ser tratadas como insumos para o Google processar e recombinar

Uma mudança contra a web participativa

  • Essa mudança não é definida como uma revolução em direção à web participativa, mas como uma contrarrevolução contra a web participativa e contra os próprios usuários
  • O objetivo é tomar a web e conduzir as pessoas para uma camada de abstração sobre ela, controlada e ajustada pelo Google
  • Isso é descrito como um problema de monopólio do acesso à informação e como o verdadeiro Metaverse, distante de padrões abertos e da capacidade de cada pessoa criar um canto da web de acordo com suas necessidades e desejos
  • Como a influência do Google sobre os padrões da web é forte, essa direção pode mudar até a forma padrão do terreno técnico sobre o qual a web é construída

O potencial de controle em nome de uma “web segura”

  • Na próxima etapa, o Google ou outras empresas do mesmo setor podem criar e disseminar um novo termo pejorativo para rotular a web tradicional como suja, descontrolada, perigosa e ruim
  • Esse tipo de nomeação funcionaria de forma parecida com “Dark Web”, ajudando a posicionar a superfície abstraída do Google como a web segura

Resposta: reduzir a dependência do Google

  • Se você valoriza a web e a capacidade de as pessoas participarem dela, em vez de serem apenas consumidores passivos, essa mudança precisa ser levada a sério
  • Torna-se mais urgente de-googlificar sua estrutura mental e digital
  • Sugere-se buscar outros mecanismos de busca e optar por não usar o navegador Chrome
  • Caso contrário, você pode acordar em um ambiente parecido com uma AOL tomada por slop, onde o acesso à informação fica limitado ao que a extrusora de texto sintético do Google considerar relevante

1 comentários

 
GN⁺ 2 시간 전
Opiniões do Hacker News
  • Parece que a IA já chegou ao ponto de “arte, código, música e escrita: se quiser fazer por satisfação pessoal, tudo bem, mas ganhar dinheiro com isso, não dá mais”
    Ganhar dinheiro com conteúdo parece algo possível só para grandes empresas, e, se você publica qualquer criação, no fim ela só volta a ser dada de comer para as máquinas e segue sendo copiada sem parar

    • “De que a máquina de imprimir dinheiro se alimenta, e o que ela expele? Juventude, espontaneidade, vida, beleza e, acima de tudo, criatividade. Ela consome qualidade e expele quantidade.” - William S. Burroughs
    • Como alguém que transformou a música em profissão e também trabalha com TI, acho bastante interessante ver como a IA generativa está se desenrolando e como a cultura ao redor dela está se dividindo
      Parece que o mundo está quase se separando em duas “sociedades”: a que gosta de IA + grandes empresas + inovação e destruição muito rápidas, e a que prefere trabalho artesanal + pequenos negócios + inovação mais lenta, mas mais sustentável
      Pessoalmente, eu gostaria de viver na segunda sociedade, mas acho que as duas podem continuar existindo e evoluindo à sua maneira
      Claro, sociedades diferentes inevitavelmente acabam interagindo e influenciando umas às outras
    • Artistas e empresas querem ganhar dinheiro, mas talvez o mais próximo da realidade seja que a IA inclinou o cenário competitivo a favor das empresas
      Vi um efeito parecido no setor hoteleiro. Hotéis, booking.com e Google todos querem ganhar dinheiro, mas o cliente normalmente pesquisa no Google por “hotel em algum lugar”, e o Google vende anúncios para essa busca, fazendo com que quem oferece mais acabe ficando com a maior parte do lucro
    • Essa estrutura precisa ser invertida
      É preciso taxar os lucros excessivos das empresas de tecnologia obtidos a partir do esforço dos outros, e usar esse dinheiro para apoiar artistas vivos
      Lembra vagamente a taxa que antigamente era cobrada sobre fitas cassete virgens para compensar a pirataria. Só que o dinheiro deveria ir direto para os artistas de verdade, não para gravadoras ou editoras
    • Pelo menos nas artes visuais, não acho muito provável que alguém que realmente goste de arte vá pendurar na parede uma imagem criada por IA
      Para esse tipo de “cliente”, não seria muito diferente de emoldurar e pendurar um pôster da Mona Lisa
      Em vez de ameaçar os artistas, a IA pode acabar tornando obras originais ainda mais valiosas e prazerosas
  • Para tentar impedir isso, há um ou dois meses coloquei a maior parte do meu site de pesquisa sobre Amazon Redshift atrás de autenticação básica com usuário/senha
    Continua tudo gratuito, mas para receber usuário e senha é preciso me mandar um e-mail
    Passei tempo produzindo esse conteúdo; se empresas como OpenAI o copiam, vendem isso via LLM, e como resultado ninguém mais visita meu site, então eu deixo de ter motivo para criar esse conteúdo. Aí não sobra nada para a OpenAI pegar, nem para outras pessoas lerem, e todo mundo perde
    Isso é parasitário e, à primeira vista, parece matar o hospedeiro. Na prática, parece quase uma abolição do conceito de propriedade privada
    As empresas de IA podem pegar o que eu criei sem meu consentimento e vender isso com lucro, e esse lucro parece vir em boa parte da recompensa que antes cabia a mim pelo meu esforço
    Procurei uma forma de sinalizar para as empresas de IA que removam meu conteúdo, mas os mecanismos oferecidos são só dispositivos nominais que jogam o ônus para cima de mim. E ainda não dá para saber se foi realmente removido. É algo como: “se você mostrar por meio de um prompt que seu conteúdo aparece, tentaremos tomar medidas para que ele deixe de aparecer”
    Como resultado de ter colocado a barreira de usuário/senha, o Google derrubou bastante o ranking do site, e agora considero que ele está praticamente impossível de encontrar nas buscas

    • Se novos usuários precisam receber usuário e senha por e-mail, isso cria fricção para quem chega agora, reduz a capacidade de descoberta e ainda traz preocupações extras de privacidade para quem quer acessar o conteúdo
      Também fico me perguntando se sinalizar às empresas de IA que não quero meu conteúdo inclui até serviços que ao menos fornecem atribuição e links para a fonte original. O Perplexity, por exemplo, faz isso relativamente bem
      Se você bloqueia o acesso ao conteúdo sem login, então também está bloqueando a indexação por mecanismos de busca, então é natural que o Google rebaixe seu ranking
      Fico um pouco confuso sobre qual é o objetivo final. Quando você publica conteúdo gratuito na web, não sei exatamente o que se ganha ao bloquear a indexação por IA, especialmente se, junto com a IA, você também está bloqueando usuários reais e a busca tradicional
      Entendo a frustração de ver ferramentas de IA digerirem seu conteúdo e depois repetirem isso ao usuário sem ligar de volta ao seu site. Mas, independentemente de IA, as pessoas sempre fizeram algo parecido. Liam um texto, aprendiam fatos ou entendiam uma nova ideia e depois incorporavam isso ao próprio trabalho sem necessariamente reconhecer ou sequer lembrar da fonte daquela informação
      A IA acelerou esse processo e o tornou mais visível, então entendo a frustração, mas talvez nunca tenha sido razoável esperar que tudo o que acontece a jusante do meu trabalho continue sempre atribuído a mim
    • Exato. Isso é uma grande transferência de poder, e tudo está se centralizando
      Como você disse, eles sabem que precisam de dados bons, então talvez de fato tentem encontrar algum ponto de equilíbrio
      Caso contrário, os laboratórios de IA podem acabar produzindo internamente o novo conteúdo valioso para alimentar os LLMs. Parece loucura, mas a Netflix também produz conteúdo próprio
      Os laboratórios de IA parecem grandes demais e provavelmente vão assumir papéis além de simplesmente oferecer inferência de LLM. Eles podem se tornar tão poderosos quanto muitos governos nacionais atuais, ou até mais
    • Também vi recentemente muitos sites de receitas mudando do mesmo jeito. Até os grandes agora estão todos exigindo conta
    • Como você pode ter certeza de que os e-mails pedindo usuário e senha vieram de humanos?
    • Bem-vindo à floresta escura
  • É difícil entender qual é o estágio final disso tudo. Os sites deixavam o Google rastrear seu conteúdo em troca de receber tráfego
    Se o Google cortar isso completamente, não vejo que incentivo sobra para que os sites não bloqueiem o crawler do Google
    Entendo sentir uma ameaça existencial em outros produtos de IA do Google que respondem diretamente, mas ele também precisa entender a relação simbiótica com a web

    • O estágio final é o consumidor nunca mais sair do Google, e para ele a web se tornar sinônimo de Google
      Por que comprar em um site aleatório, se o Gemini pode comprar por você? Para que ir à Wikipedia buscar informação... você entendeu
      Os próximos anos parecem decisivos para a web. O Facebook tentou uma estratégia parecida quando os apps ganharam força, mas no fim fracassou. Espero que o Google também fracasse
    • O que eu realmente não entendo é de onde vai sair a próxima geração de material de treinamento
      Se os sites deixarem de publicar ou de serem rastreados, de que as máquinas vão continuar se alimentando para funcionar?
    • Os executivos de onde eu trabalho parecem achar que devemos continuar escrevendo, que os LLMs vão raspar isso, e que o resultado vai influenciar o que as pessoas veem em seus respectivos Google, ChatGPT e semelhantes
      Então, na cabeça deles, nada muda; o leitor só deixou de ser humano e passou a ser bot. Para quem escreve, isso é horrível
    • Os ganhos de curto prazo de quem está no poder são tratados como mais importantes do que as consequências de longo prazo
    • A web vai virar, como na China, um conjunto de jardins murados
  • Há muito tempo deixamos o Google encarregado de enviar tráfego para os sites
    Em grande parte porque o Google fez isso tão bem que as alternativas ficaram muito menos úteis
    Agora que o Google está focado, por assim dizer, em ser “autocontido”, precisamos encontrar uma forma melhor de enviar tráfego aos sites. Idealmente, uma forma que não esteja sob o controle de uma única empresa
    Mais alguém com saudade do StumbleUpon?

    • É estranho que não exista busca descentralizada
      Entendo que provavelmente isso decorre da própria natureza do problema, mas antigamente surgiam um monte de ideias descentralizadas absurdamente inadequadas, então chama a atenção
    • Seria bem legal existir uma forma aberta de trocar, salvar e exportar listas de sites que funcione de modo fluido em navegadores desktop e mobile
    • Será que essa mudança dá mais poder ou valor a sites como o reddit?
      Sites com coleções bem organizadas de links são muito mais úteis para descobrir novos sites
    • Também existe o marketing à moda antiga. Se você quer ser ouvido, precisa ir atrás do seu público diretamente
  • Como operador de site, vi o número de visualizações aumentar bastante, mas é realmente devastador ver um resumo de IA errado com meu site citado como fonte
    Esse movimento de empurrar IA para tudo parece que no fim vai reduzir o nível de habilidade do mundo, e isso me preocupa porque não vejo como impedir

    • Essa ideia de “reduzir o nível de habilidade do mundo” realmente faz sentido para mim
      Hoje perguntei a um desenvolvedor como nosso produto está programado para lidar com determinada situação, e ele só me enviou o resumo do assistente interno de IA que começou a usar agora
      Antes ele dava respostas realmente boas e bem pensadas; agora é só copiar e colar resposta de IA
  • Mas parece que eles são contra quando são eles que estão sendo raspados: https://serpapi.com/blog/google-v-serpapi-motion-to-dismiss-...

  • Se a web não já estivesse tão apodrecida desde o início, eu acharia isso mais triste
    Em média, qualquer site em que você entra só quer te jogar anúncios e te importunar para assinar algo

    • Tenho desprezo especial por modais de “assine a newsletter”. Ainda mais quando aparecem depois de menos de 3 segundos totais vendo a página
      Não entendo por que isso não é considerado pop-up
    • A podridão é mais profunda, e não é só um problema de anúncios
      A estrutura de incentivos dos mecanismos de busca favorece conteúdo recente em vez de conteúdo bom, então todos os sites ficam despejando coisas que parecem lixo gerado continuamente
      Hoje em dia, se o resultado da busca traz um carimbo de data dos últimos 2 anos, eu parto do princípio de que é lixo e nem clico
      Talvez a resposta seja migrar para o Kagi. Lá eu sou cliente, não produto
      Honestamente, nem todos os sites são assim, e ainda existem lugares bons. Mas os mecanismos de busca nunca te levam até eles. Só mostram porcaria o dia inteiro
    • Claro, e o Google não teve absolutamente nada a ver com criar esse estado das coisas, né
    • Essa podridão é consequência direta da economia da publicidade da qual o Google ficou com todo o dinheiro
      Mesmo que alguém pudesse ter feito isso no lugar dele, quem de fato fez foi o Google, e ele contaminou o poço de onde todos nós bebemos
    • Tentei ler notícias do I/O em algum blogzinho sem força de fãs do Google
      Quando cheguei mais ou menos no meio do texto, havia três anúncios enormes ocupando a parte de cima, a direita e a de baixo, consumindo mais espaço do que o próprio conteúdo, e no canto inferior direito ainda flutuava um anúncio em vídeo com reprodução automática cobrindo boa parte de um dos banners
      O anúncio “dinâmico” no meio do texto ficava crescendo e encolhendo de repente, travando tudo, a ponto de eu realmente não conseguir ler nada
      E isso já é uma das experiências relativamente melhores ao tentar ler esses blogs modernos ou coisas parecidas. Está chegando perto do nível de sites pornôs suspeitos
      É triste e patético
  • Muitas vezes esse tipo de declaração não faz muito sentido para mim, porque não bate com o modelo de problema que eu enxergo
    Eu sou alguém que escreve blog, ou, no jargão atual, um “produtor de conteúdo”, mas também sou usuário
    Como usuário, eu quero que o agente de usuário do meu navegador exiba páginas da web para mim, e quero que um agente de busca extraia informações de várias fontes e as sintetize com a devida atribuição
    Dá para rebater dizendo que talvez eu seja indiferente à intermediação por plataformas porque minha produção de conteúdo é hobby. Isso é verdade até certo ponto. Se eu dependesse disso para viver, talvez concluísse que prejudicar meu sustento é uma guerra contra a “web”
    Só que, para um observador neutro, mesmo que isso seja uma guerra, ela seria uma guerra contra a minha forma de participar da web por meio da criação de conteúdo com fins de receita, reputação e recompensa
    Como usuário, no fundo eu não me importo muito com cada site ou criador individual. A informação contida neles é útil, mas a heterogeneidade dos sites em geral é um obstáculo ao acesso à informação
    Se agentes de busca e resumo conseguissem sintetizar com precisão o que esses sites dizem e tornar meu modelo da realidade mais preciso, eu ficaria muito mais satisfeito
    Então eu posso ser convencido pelo argumento de que as mudanças do Google reduzem a chance de conteúdo correto ser criado e fazem com que eu seja enganado com mais frequência. Mas isso é uma ferramenta, e meu modelo de mundo será testado pela realidade com frequência
    Se a máquina de busca e síntese não produzir resultados úteis, eu vou perceber e vou ajustar a forma como trato esse conhecimento para evitar consequências fatais. Mas isso já é assim hoje
    Eu não tenho como saber se os resultados do Google não são resultados plantados e ajustados para mudar minha opinião, nem se o Google não está em conluio com o Internet Archive para fabricar um consenso com aparência de verdade
    Como usuário, eu já preciso tomar muitas decisões, e ler resultados de busca penosamente para sintetizar por conta própria é muito menos útil do que usar agentes
    Então, se existe uma guerra contra a web, eu participo dela com prazer. Do lado contra a web

    • Concordo que seria bom se agentes de busca e resumo sintetizassem com precisão o que os sites dizem, mas no meu caso o objetivo é só decidir se vou ler a página inteira
      É como um resumo de enredo ajudar você a decidir se quer ver um filme, sem ser substituto de assistir ao filme de fato
      Para buscas como “50 usd in eur” ou “current weather in Paris”, tudo bem a IA responder. Para algo mais complexo do que isso, prefiro muito mais receber links para as fontes reais
    • Não tem como eu não concordar com a ideia de ficar do lado contra a web
      A parte otimista é que isso parece empurrar ainda mais na direção para a qual a “web” já vinha há muito tempo: uma direção que atrapalha o usuário a obter a informação correta de forma honesta e eficiente, preservando seu orçamento de atenção e seu poder de escolha
      Até agora, isso acontecia aumentando o ruído por incentivo financeiro; agora acontece cortando o ruído por incentivo financeiro
      O motivo para algum otimismo é que, até aqui, não havia um inimigo único, então era difícil lutar contra um sistema meio disperso, mas agora o Google, ao piorar ainda mais a situação, está tornando a si mesmo e algumas poucas outras empresas alvos bem claros
      Espero que isso faça mais gente ultrapassar o limite da paciência e tentar voltar para a “velha web”, de antes de Google e redes de anúncios a terem transformado, ou então encontrar novas formas de acessar livremente uns aos outros e ao conteúdo
      Não será uma luta pequena nem fácil. Em grande parte, é uma luta contra o estado atual do capitalismo e para recuperar nossa atenção, nosso pensamento crítico e nosso poder de escolha
  • Eles deveriam pagar aos donos de sites pelos dados que usam

  • Agora eu já nem sei se isso é uma coisa ruim
    A web está tão inundada de lixo de SEO que talvez seja necessário o Google ir embora e acontecer uma depuração ao estilo Usenet

    • Como consumidor, eu até gosto bastante da busca atual do Google
      Os recursos de IA normalmente já me dizem o que eu quero saber, e, se eu quiser verificar os fatos, em geral eles também colocam links para as fontes. O jeito tradicional baseado em links também funciona
      Quem diz que ficou inutilizável geralmente não consegue dar exemplos concretos do que realmente não conseguiu encontrar
      Eu também já vi algumas áreas fracas. Material antigo e obscuro parece ser um limite da maioria dos buscadores, e para material relacionado à pirataria dá para usar o Yandex