2 pontos por GN⁺ 2025-10-22 | 3 comentários | Compartilhar no WhatsApp
  • A enciclopédia online Wikipedia anunciou recentemente que as visitas diretas às páginas estão caindo por conta de resumos de busca por IA e vídeos de mídia social.
  • A Wikimedia Foundation disse que o número de visitantes humanos caiu 8% em comparação ao ano anterior, e isso é resultado da contagem de tráfego real de humanos após uma atualização do sistema de detecção de bots.
  • A análise mostra que resultados de busca com IA que entregam respostas diretamente reduzem os cliques para os sites, enquanto gerações mais jovens tendem a usar plataformas de vídeo social como TikTok para buscar informações.
  • A Wikipedia interrompeu o experimento de sua própria função de resumo por IA e defende que empresas de IA e de mecanismos de busca devem arcar com a responsabilidade de indicar fontes e induzir visitas aos sites.
  • Ela afirmou que a origem do conhecimento usado pela IA continua sendo conteúdo criado por pessoas, enfatizando a importância de conferir fontes confiáveis e reconhecer o valor da curadoria humana do conhecimento.

Queda de tráfego da Wikipedia

  • A Wikipedia é frequentemente citada como uma das últimas grandes referências confiáveis da web.
  • Porém, conforme relatório recente da Wikimedia Foundation, a visualização de páginas por usuários humanos caiu cerca de 8% em comparação com o mesmo período do ano passado.
  • A fundação aprimorou os sistemas para distinguir o tráfego humano do de bots e constatou que parte do tráfego excepcionalmente alto em maio e junho era de bots que escapavam da detecção.
  • Marshall Miller, da fundação, descreveu esse fenômeno como uma mudança estrutural causada por resumos de busca por IA e pelo aumento do consumo de vídeos sociais.
    • Mecanismos de busca estão migrando para exibir respostas geradas por IA diretamente, em vez de links para os sites.
    • As gerações mais jovens estão usando plataformas de vídeo como TikTok e YouTube Shorts para buscar informações em vez da web aberta.
    • A Google refutou, dizendo que a busca com IA não reduz o tráfego.

Posição e resposta da Wikipedia

  • Miller disse que é positivo que as pessoas busquem conhecimento de novas formas, e ressaltou que o conteúdo da Wikipedia continua a ser usado para treinamento e resumo de modelos de IA.
  • No entanto, a queda de visitantes traz um risco concreto de redução no número de voluntários que contribuem e mantêm o conteúdo, além de possível queda de doações.
  • De fato, alguns editores criticaram problemas de qualidade em resumos gerados por IA, e a fundação suspendeu temporariamente seu programa-piloto de resumo por IA.

Redefinindo a relação com empresas de IA

  • Miller afirmou que plataformas de IA, busca e mídia social que aproveitam o conteúdo da Wikipedia devem, necessariamente, contribuir para o ecossistema por meio de indicação de fontes e direcionamento de visitas.
  • A Wikipedia está desenvolvendo uma nova estrutura de atribuição de fontes de conteúdo e mantém duas equipes especializadas para conquistar novos públicos.
  • Além disso, a organização conduz uma campanha para ampliar a participação de voluntários.

A importância do conhecimento baseado em confiança

  • Miller enfatizou que “a origem do conhecimento resumido por IA ainda é trabalho intelectual humano”.
    • Os usuários devem, ao buscar, conferir as citações e visitar a fonte original.
    • É necessário manter a sustentabilidade do ecossistema de conhecimento com curadoria humana confiável.
  • Ele disse que “a transparência das fontes e a continuidade da participação humana são os valores centrais da era da IA”.

3 comentários

 
coremaker 2025-10-23

Se os modelos de IA e as empresas que os criam não fizerem esforços para construir confiança,
em longo prazo, acho que a Wikipédia pode acabar tendo mais oportunidade de crescer.

 
shakespeares 2025-10-23

Virou um site em que os dados só foram roubados.

 
GN⁺ 2025-10-22
Discussão no Hacker News
  • Acho que a Wikipédia é essencial e, em si, tudo bem que o tráfego esteja caindo. A enciclopédia em papel foi substituída pela Wikipédia, mas a IA jamais vai substituir aquele lugar. IA é apenas uma ferramenta que facilita o acesso; a Wikipédia tem seu próprio propósito e valor. Sempre fui cético com relação ao acúmulo de recursos da Fundação Wikimedia e ao aumento constante dos custos anuais. Espero que agora seja um bom momento para cortar despesas e ficar financeiramente independente para durar mil anos. Acho que a Wikipédia deve existir e operar para o bem público.

    • Penso que a Fundação Wikimedia dificilmente vai durar mil anos. O próprio sistema social e econômico provavelmente não vai durar tanto. O governo dos EUA já demonstra movimentos incômodos em relação à Wikimedia. Mesmo se migrar de um país para outro, isso dificilmente vai sustentar por tanto tempo. Dada a fragilidade da civilização tecnológica e do armazenamento de dados, é incerto se a própria Wikipédia pode durar tanto. Artigo relacionado

    • A Wikipédia disponibiliza publicamente dumps de dados, então imagino que existam muitas cópias offline. Acho que, quando a Wikimedia fala de queda de tráfego, talvez não seja por razões comerciais de receita de anúncios, mas porque a forma como usuários da web procuram informação mudou. Para um site que não vende usuários para publicidade, redução de tráfego não é necessariamente um problema. Isso não significa que as informações oferecidas tenham menos valor.

    • Sempre me perguntei sobre a estratégia de acumular dinheiro e investimento durante crescimento para sobreviver no longo prazo. Se uma diversificação desses investimentos permitir operar mesmo sem entrada externa de recursos, seria possível focar na visão original e no que é certo sem ficar preso a resultados trimestrais. É claro que é possível continuar gerando receitas, mas o ideal é pensar em operação de longo prazo preservando a essência.

    • A Wikipédia é realmente incrível. Qualquer pessoa, em qualquer tema, pode escrever o artigo que quiser. Dá para ter confiança de que existe acesso à melhor informação.

    • Fico curioso sobre o uso do dinheiro da Fundação Wikimedia. Se dizem que os gastos estão aumentando continuamente, para onde vai esse dinheiro? Eles ainda tentam se expandir para outros projetos? Entendo que um site global desse porte tem custos de hospedagem consideráveis, mas me pergunto se isso cresceu tanto.

  • Como uma organização sem fins lucrativos 501(c)(3), se o tráfego não afeta diretamente a receita, me pergunto se é preciso encarar uma queda de tráfego como algo ruim. Sempre achei que pressão por crescimento agressivo fosse restrita a empresas de venture capital ou de publicidade.

    • Na prática, a Wikipédia também depende bastante de tráfego web. Mesmo com menos visitantes humanos, crawlers de IA raspam uma quantidade enorme de dados, aumentando os custos.

    • Queda de tráfego pode levar a redução de voluntários e doadores. Menos visitantes diretos podem significar menos pessoas para refinar conteúdo ou contribuir financeiramente.

    • Isso não é apenas sinal de queda de receita com publicidade, mas também de que as doações podem cair. Atualmente, muita gente paga por assinaturas de IA e quase não olha a Wikipédia. A fonte primária da informação está sendo consumida em etapas intermediárias. Parece uma discussão antiga sobre direitos autorais, só que agora o agente principal não é um indivíduo, e sim grandes empresas com fins lucrativos.

  • Sinto que os LLMs (modelos de linguagem de grande escala) já substituíram cerca de 90% da informação que eu procurava na Wikipédia, porque conseguem integrar uma gama muito maior de fontes. Ao mesmo tempo, continuo contribuindo com edições na Wikipédia. Se a informação que editei é consumida na Wikipédia ou via LLM, o mais importante é que ela ajude alguém. A Wikipédia não vai desaparecer só porque as pessoas deixam de consumir informação no próprio site.

    • A Wikipédia oferece suas produções gratuitamente para todos. Empresas de LLM não fazem isso. Até o Google opera assumindo prejuízo. É difícil dizer que realmente "ajudam pessoas"; o contrário muitas vezes é verdadeiro.
  • Na prática, acredito que os LLMs acabarão substituindo a Wikipédia por completo. Deixando de lado problemas de burocracia rígida, obsessão por edição e vieses, a Wikipédia já era, em essência, um mecanismo humano de sumarização que agregava fontes secundárias para chegar a consensos. E esse é justamente o ponto que os LLMs dominam melhor. Treinando com bons livros, é possível até superar a qualidade da Wikipédia. Pela primeira frase de um resumo de IA, já dá para ver os temas principais com clareza. A Wikipédia, por outro lado, tem uma tendência a tornar até a primeira frase desnecessariamente complexa por conta de disputas políticas entre editores.

    • Mesmo que tudo isso seja real, os LLMs ainda precisam de um repositório de resumos de fontes secundárias. LLMs não conseguem procurar e ler milhares de fontes secundárias em tempo real. Muitos materiais já sumiram ou ainda não foram digitalizados. No futuro, pode surgir um cenário em que laboratórios de LLM contribuam para a Wikipédia e, por meio de agentes de IA, façam sugestões de edição e fact-checking.

    • Mesmo com essa ideia de substituição por LLMs, espero que a Wikipédia continue existindo porque quero que ela ajude as pessoas a manter um pensamento crítico e não caírem em golpes.

    • Não concordo com a tese de que basta treinar apenas com bons livros. Para muitos temas da Wikipédia, nem mesmo bons livros existem. E também é problemático definir quem decide esse padrão. Queda de tráfego não é algo exclusivo da Wikipédia; também afeta outros sites. A IA está fazendo desaparecer as próprias fontes das quais ela depende. Este é justamente o auge da IA. O próximo ciclo terá menos boas fontes originais e mais conteúdo gerado por IA, com o surgimento de sites cujo objetivo é prejudicar LLMs. Debate relacionado

  • Conhecimento não existe por si só; é uma questão de como as pessoas organizam a informação. A IA vai continuar minerando conhecimento existente e mostrando-o de forma cada vez mais conveniente, mas acredito que os princípios básicos de organização de informação e conhecimento não vão mudar drasticamente. A IA, no entanto, pode mudar a organização nessas áreas:

    1. Fact-check e verificação de fontes
    2. Redação de rascunhos de novos tópicos
    3. Refinamento de frases e edição A Wikipédia já tem muitos bots operando nos bastidores, e mesmo que a IA faça todo esse trabalho, a parte que sobra continua sendo a decisão humana (ou de outra IA).
    • Se há múltiplas perspectivas sobre os fatos, como expressá-las de forma equilibrada? (pensei em inúmeras discussões entre editores)

    • Na era de smartphone e redes sociais, com um monte de pessoas comuns registrando a história, como resumir e organizar isso?

    • Como projetar incentivos para que humanos e IA contribuam adequadamente?

    • Como preservar a independência da Wikipédia (questão geopolítica)? Só para contextualizar: já conduzi um serviço wiki na China. O desafio maior foi perceber que quase ninguém refletia seriamente sobre por que o formato wiki era necessário e deveria continuar, além de apenas buscar informação.

    • Curti a ideia de usar IA para melhorar a Wikipédia. Há muito espaço para pequenos trabalhos serem tratados por agentes de IA relativamente simples. Por exemplo, entrar em todos os artigos em inglês sobre cidades da Espanha e comparar dados como população e nome do prefeito com a Wikipédia em espanhol para corrigir com informações mais precisas. Se esse agente só cria rascunhos e um editor humano revisa, fica mais eficiente atualizar pequenas informações.

  • Desde que o Google passou a oferecer resumos de IA, um fenômeno parecido aparece em quase todos os sites.

  • Embora o impacto da IA seja óbvio, fico em dúvida sobre o que significa exatamente "vídeos sociais". Isso quer dizer que as pessoas estão assistindo TikTok no lugar da Wikipédia? Ou que elas pararam de procurar diretamente?

    • Na prática, os mecanismos de busca mais usados hoje são YouTube e TikTok.

    • Na Geração Alpha, o TikTok já é o principal canal para obter notícias e conhecimento.

  • Espero que o mesmo fenômeno aconteça com todos os sites com foco em SEO. Debate relacionado

    • Acontece em todos os sites. Até em sites bons sem publicidade, bots de IA adicionam tráfego desnecessário. Isso aumenta ainda mais os custos operacionais. Além disso, vão surgir incontáveis sites com o objetivo de causar impacto negativo em LLMs. No fim, isso pode fazer com que os próprios LLMs tenham custos maiores ou passem a inserir publicidade.
  • A tendência de queda no número de contribuintes na Wikipédia já vinha ocorrendo. Se as pessoas que leem diretamente a Wikipédia diminuírem, a queda de colaboradores provavelmente piora. Ainda assim, fico curioso se já existem experimentos que usem LLMs para complementar, melhorar e validar a Wikipédia. No futuro, os debates e conflitos de edição existentes podem virar uma dinâmica de confronto entre agentes de LLM, misturando colaboração e competição.

    • Muitas tarefas feitas por contribuidores também tendem a ser processadas de forma eficiente por agentes de IA. O essencial será a) participação e monitoramento humanos e b) um sistema de filtragem de comportamento malicioso.

    • Há problemas no modelo de operação atual. Quando um colaborador adiciona novo conteúdo, spammers trocam os links de páginas legítimas por links de spam. Os bots da Wikipédia então removem esse conteúdo. O resultado é que o colaborador se desanima.

  • A Wikipédia foi uma ferramenta quase mágica, à frente de seu tempo, e seu valor como melhor agregador de informação ainda permanece. Ela provavelmente vai sobreviver por bastante tempo como uma teia de links. A curadoria em tempo real no momento da leitura é muito melhor, mas antes era difícil e hoje isso virou viável a baixo custo. A Wikipédia deve continuar sendo uma fonte de dados para várias ferramentas de curadoria em tempo real. Só o fato de ter uma base assim já aumenta o valor de muitas ferramentas de IA. Muitas pessoas levantam críticas sobre a visão única ou interesses pessoais dos editores, e isso é compreensível. Mas com interface de chat de LLM dá para interagir, entender contexto e se aprofundar. Pessoalmente, é muito bom participar dessa construção de infraestrutura de conhecimento aberto. Sinto gratificação só de corrigir pequenos erros em páginas da Wikipédia. Há bastante coisa fácil de corrigir desse jeito. Até mesmo conteúdos feitos sem cuidado por alguém acabam sendo descobertos e corrigidos facilmente. Exemplo de página

    • A curadoria em tempo real na leitura é claramente superior. No entanto, ter a Wikipédia no celular e buscar imediatamente ali é realmente barato. LLMs são muito pesados e a maioria das pessoas não consegue rodá-los localmente. Há também perda de dados, como no processo de sumarização. Seria ótimo se ambos rodassem no celular, mas há muitas preocupações com propriedade de dados.