2 pontos por GN⁺ 2026-01-23 | 1 comentários | Compartilhar no WhatsApp
  • O Google detém mais de 90% do mercado global de busca, o que leva a uma estrutura em que uma única empresa controla a infraestrutura central para o avanço da IA e o acesso à informação
  • Em agosto de 2024, um tribunal dos EUA decidiu que o Google abusou de sua posição monopolista em serviços de busca gerais; depois disso, o DOJ (Departamento de Justiça dos EUA) anunciou medidas corretivas, incluindo abertura do índice e compartilhamento de dados
  • A Kagi é um serviço de busca pago sem anúncios e, após fracassar nas negociações de licenciamento direto com Google e Bing, usa atualmente uma abordagem temporária de acesso via APIs de terceiros
  • Se a proposta corretiva do DOJ for implementada, o Google terá de fornecer seu índice de busca e resultados baseados em consultas aos concorrentes em condições justas, o que ampliaria as oportunidades de inovação para empresas independentes de busca, como a Kagi
  • A Kagi busca um ecossistema em camadas no qual coexistam busca pública, com anúncios e paga, com o objetivo de restaurar o acesso à informação como um bem público

A realidade do monopólio da busca

  • Segundo os dados da StatCounter de outubro de 2025, a participação global do Google em busca é de 90,06% e, nos EUA, de 85%
    • Bing 4,31%, Yandex 1,84%, Yahoo 1,45%, DuckDuckGo 0,89%, Baidu 0,73%
  • Isso não configura um mercado competitivo, mas sim uma estrutura de monopólio de fato, em que o índice de busca funciona como uma infraestrutura central insubstituível
  • Mesmo após a Microsoft investir cerca de US$ 100 bilhões no Bing ao longo de 20 anos, sua participação continua em um único dígito
  • O Sherman Act é citado como a lei criada para regular esse tipo de monopólio sobre infraestrutura essencial e como base para impor acesso justo
  • O texto também alerta que, quando um único gatekeeper baseado em publicidade controla o acesso à informação, isso prejudica a capacidade de tomada de decisão democrática e de aprendizado social

A abordagem e os limites da Kagi

  • A Kagi é um serviço de busca por assinatura, sem anúncios, que integra várias fontes de dados para oferecer resultados de alta qualidade
  • Em negociações com os principais provedores de índice sob termos FRAND (justos, razoáveis e não discriminatórios), firmou licenças diretas com Mojeek, Brave, Yandex, Wikipedia, TripAdvisor, Yelp, Apple, Wolfram Alpha e outros
  • Porém, as negociações com Google e Bing fracassaram
    • O Bing proibiu a reordenação e a mesclagem de resultados e encerrou a Bing Search API em agosto de 2025
    • O Google não oferece uma API pública de busca e só permite parcerias em formato vinculado a publicidade
  • Com isso, a Kagi obtém resultados por meio de provedores terceirizados de API de SERP, mas isso é apenas uma medida temporária

O processo antitruste contra o Google e a proposta corretiva do DOJ

  • No processo Departamento de Justiça dos EUA (DoJ) vs. Google, iniciado em 2020, o tribunal decidiu em agosto de 2024 que o Google violou a Seção 2 do Sherman Act ao manter seu monopólio
  • Em setembro de 2025, o DOJ anunciou as seguintes medidas corretivas
    • Restrição a contratos de exclusividade: proibição de contratos exclusivos relacionados a Search, Chrome, Assistant e Gemini
    • Compartilhamento de dados: fornecimento do índice de busca e de dados de interação a concorrentes
    • Proibição de vinculação com publicidade: o acesso aos resultados de busca não pode ser condicionado ao uso do Google Ads
    • Acesso aos dados do índice: URLs, metadados de rastreamento, pontuações de spam etc. devem ser fornecidos ao nível do custo marginal
    • Prazo de vigência: validade de 6 anos, com período de licença garantido de 5 anos
  • A Kagi espera que, se essas medidas entrarem em vigor, o acesso justo ao índice se torne possível

A importância da implementação e da aplicação

  • Em dezembro de 2025, o Google moveu um grande processo por scraping contra a SerpApi
  • A Kagi aponta isso como “um problema estrutural causado porque o Google não oferece acesso legal ao índice
  • No passado, o Google construiu seu índice rastreando livremente a web antes da consolidação das normas do robots.txt, mas hoje usa sua posição monopolista para restringir o acesso de terceiros
  • A Kagi mantém a posição de que “quer licenciamento direto e acesso legal” e enfatiza que a proposta corretiva do DOJ deve resultar em garantia real de direito de acesso

A visão de um ecossistema de busca em camadas

  • A decisão do DOJ não cria imediatamente um mercado saudável, mas estabelece a base para uma concorrência justa
  • A Kagi apresenta uma estrutura de busca em 3 camadas
    • Camada 1: serviço público de busca (search.org) operado pelo governo — acesso à informação sem fins lucrativos, sem anúncios nem intermediação
    • Camada 2: busca gratuita baseada em anúncios — focada em funções comerciais
    • Camada 3: busca paga por assinatura — focada em qualidade, privacidade e recursos avançados (área da Kagi)
  • Esse modelo propõe uma estrutura em que coexistem acesso público à informação, conveniência comercial e concorrência por qualidade premium, em linha com o espírito do Sherman Act

Conclusão

  • As medidas do DOJ são o primeiro passo para transformar uma infraestrutura monopolista fechada em infraestrutura pública aberta
  • Se o Google oferecer acesso ao índice em condições justas, será possível haver concorrência inovadora no ecossistema de busca e IA
  • A Kagi continua expandindo a busca baseada em múltiplas fontes e seu próprio Small Web Index, enquanto se prepara para um modelo de acesso legal e transparente
  • O objetivo é construir um “ecossistema de busca que restaure o acesso à informação como bem público”, o que, nos próximos 10 anos, poderá levar à recuperação da diversidade em IA e busca

1 comentários

 
GN⁺ 2026-01-23
Comentários no Hacker News
  • Construir do zero o índice de busca do Google é uma tarefa gigantesca, como instalar uma nova malha ferroviária nacional
    Tenho duas dúvidas. Primeiro: por que outras big techs não criam seus próprios índices para quebrar o monopólio do Google? Se isso fosse oferecido como um bem público, como os datasets de treino para LLMs, poderia trazer mudanças renovadoras para toda a UX. Segundo: o Departamento de Justiça publicou diretrizes relacionadas a monopólio, mas por que isso não pode ser imposto em nível estadual?

    • O Google, no começo, construiu seu índice rastreando livremente toda a web antes de o robots.txt se tornar algo difundido. Hoje, usa sua fatia de 90% de mercado para restringir outros crawlers. Ou seja, as regras que o Google aplica hoje são regras que ele mesmo não seguiu quando estava crescendo
    • Criar um índice é fácil, mas criar “um novo índice” é muito difícil. O ranqueamento também não é algo simples no nível de um BM25. Para mudar os padrões do Google e os hábitos dos usuários acumulados ao longo de 25 anos, seriam necessárias medidas antitruste ou alternativas técnicas
    • Fazer scraping já é difícil, e scraping de alta qualidade é ainda mais difícil. Já houve tentativas de criar um índice público, mas nenhuma deu certo
    • O Google já tem reconhecimento de marca a ponto de virar verbo, então competir é quase impossível
    • Apple, Microsoft, Meta e Amazon parecem manter um acordo tácito em que deixam o mercado de anúncios com o Google e cada uma protege seu próprio território. Os anúncios do Google funcionam como um imposto sobre a web, e mesmo que existisse um índice público, a estrutura de receita dos operadores de sites não mudaria. O Google sabe muito bem disso
  • Estou torcendo pela Kagi. Entendo a tecnologia, mas não conhecia bem a estrutura interna do setor de busca, e a transparência deles me impressionou. Ainda assim, é incerto se o Google realmente vai cumprir as medidas corretivas. Mesmo assim, ainda há um pouco de esperança

    • Eu torço pela Kagi por causa do recurso de bloqueio (block feature). Ele permite filtrar completamente sites ruins tomados por SEO
  • É difícil confiar nas estatísticas do artigo. Cerca de 20% do mundo está em regiões onde o Google é bloqueado, então dizer que “90% do mundo usa Google” parece exagero. Na prática, isso parece ser uma estatística centrada nos EUA

    • Na página da Wikipédia sobre participação de mercado dos mecanismos de busca, a Rússia aparece com Yandex 70%, a China com Baidu 59%, a Coreia do Sul com Naver 59% e o Japão com Google 76%, mostrando grandes variações regionais
    • Como os usuários chineses não podem escolher o Google, parece que foram excluídos da estatística. Os dados da StatCounter têm baixa representatividade
    • De qualquer forma, a Kagi provavelmente também não poderá ser usada na China
    • A maioria dos países onde o Google é bloqueado são lugares em que empresas ocidentais têm dificuldade de entrar por razões éticas. Com a Kagi seria igual
  • Foi interessante ver a Kagi dizer que não pode usar diretamente a API do Google e por isso recorre a APIs de terceiros, como a SerpAPI. É irônico que empresas do grupo Google, como a DeepMind, também estejam entre os clientes. Mas, no fim, as queries da Kagi podem ser encaminhadas ao Google, então há limites na política de privacidade

    • Alguém descreveu isso dizendo que, como o Google não permite, a Kagi estaria “roubando e revendendo”
      • Mas usar informações publicamente disponíveis na web é uma zona cinzenta legal. O próprio Google, no começo, rastreava a web sem pedir permissão
      • Do ponto de vista antitruste, o índice de busca deveria ser tratado como infraestrutura pública. A ideia é que, como ferrovias ou redes de comunicação no passado, ele deveria ser separado e compartilhado
      • Na prática, só o crawler do Google recebe tratamento especial, então fica difícil para novos buscadores competirem
      • Também houve a visão cínica de que “não existe ética quando se trata de ganhar dinheiro”
      • E apareceu a opinião de que “o recurso de resumo por IA do Google não faz, no fundo, a mesma coisa?”
  • Na Europa, estão em andamento projetos como a Open Web Search Initiative e o Open Web Index. Com a participação de 14 instituições de pesquisa, eles estão construindo uma infraestrutura pública de índice da web, com a intenção de fornecer dados estruturados que possam ser usados por mecanismos de busca e LLMs

  • Houve quem apontasse que, na explicação dos planos da Kagi, ela foi descrita como uma busca “paga, baseada em assinatura”, mas faltou a expressão “sem anúncios (ad-free)”

    • Algumas pessoas disseram que desconfiar da Kagi por causa de uma palavrinha dessas é desviar o foco da discussão. É pouco provável que a Kagi inclua anúncios e, mesmo que inclua, poderia ser algo como anúncios opt-in
    • Outros consideraram que não há grande problema, já que existe a frase “não vendemos a atenção do usuário”
    • Do ponto de vista de quem paga, se começarem a aparecer anúncios, a assinatura será cancelada na hora. A experiência de busca sem anúncios é o valor central
    • Também houve um comentário brincando com algo como “pago, sem anúncios, sem amianto”, alertando contra teorias da conspiração exageradas. A piada vinha acompanhada de um link para xkcd 641
  • O Google apresentou recurso e pedido de suspensão da execução em relação às medidas corretivas desta decisão. Os documentos relacionados estão públicos no CourtListener. Fico curioso para saber se a Kagi vai apresentar um amicus brief em apoio aos autores. O Google também pode financiar organizações amigáveis para isso, como fez no recurso da Epic no passado (matéria relacionada)

  • Eu às vezes digo “dar um Google”, mas na prática uso Kagi ou DDG

    • Esse tipo de genericização da marca é juridicamente desfavorável ao Google, como aconteceu com “Aspirin”, que perdeu proteção marcária
    • Eu tento usar expressões neutras em relação à marca, como “pesquisar na web”
    • Em italiano, “to google” vira “googl-are”, mas se trocar por Kagi fica “kag-are”, que na gíria significa ‘fazer cocô’, o que acharam engraçado
    • Assim como “Xerox” ou “Kleenex”, Google virou substantivo comum, mas ainda está em situação de monopólio de fato
    • A maioria das pessoas nem conhece a Kagi, então dá preguiça de explicar
  • O assistente de IA da Kagi é satisfatório porque oferece resumos centrados em fontes. Como não tenta imitar uma personalidade como Claude ou ChatGPT, é bom para pesquisa. Respostas baseadas em fontes são seu principal ponto forte