- A Cloudflare anunciou que pretende lançar no próximo ano um marketplace em que proprietários de sites poderão vender acesso de scraping ao conteúdo de seus sites para provedores de modelos de IA
- Esse marketplace é a etapa final de um plano maior do CEO da Cloudflare, Matthew Prince, para permitir que publishers controlem melhor como e quando bots de IA fazem scraping de seus sites
- Como primeiro passo, a Cloudflare lançou o AI Audit, uma ferramenta gratuita de observability
- Proprietários de sites recebem um dashboard com análises sobre a frequência com que modelos de IA fazem scraping do site
- Com o AI Audit, proprietários de sites podem bloquear bots de IA ou permitir scrapers específicos
- A demonstração do AI Audit permite que proprietários de sites vejam de onde vem cada scraper, oferecendo uma janela opcional para verificar com que frequência provedores de modelos de IA como OpenAI, Meta e Amazon visitam o site
- Resolvendo um problema da indústria de IA
- Provedores de modelos de IA fazem scraping de milhares de pequenos sites e usam isso como informação para alimentar LLMs
- A maioria dos sites não recebe nenhuma compensação, o que pode quebrar o modelo de negócios de muitos deles
- A Cloudflare lançou um botão que permite aos proprietários de sites bloquear bots de IA
- Atendendo às demandas dos clientes
- Os clientes da Cloudflare pediam ferramentas para escolher quais modelos de IA podem acessar seus sites
- As novas ferramentas da Cloudflare permitem bloquear alguns crawlers de IA enquanto outros são autorizados
- Objetivo do marketplace
- O marketplace da Cloudflare permitirá que pequenos publishers negociem com provedores de modelos de IA
- Os sites poderão definir uma taxa de scraping ou solicitar créditos dos laboratórios de IA
- Impacto no ecossistema de IA
- A situação atual, em que algumas empresas de IA não pagam nada pelo conteúdo, não é sustentável
- O CEO da Cloudflare acredita que esse marketplace será, no fim das contas, positivo para o ecossistema de IA
Resumo do GN⁺
- A Cloudflare anunciou planos para lançar um marketplace em que proprietários de sites poderão vender acesso de scraping ao conteúdo para provedores de modelos de IA
- Com a ferramenta AI Audit, proprietários de sites poderão analisar com que frequência modelos de IA fazem scraping de seus sites
- O marketplace permitirá que pequenos publishers negociem com provedores de modelos de IA, possibilitando receber compensação pelo conteúdo
- Isso pode contribuir para aumentar a sustentabilidade do ecossistema de IA
2 comentários
A proposta é boa.
Opiniões no Hacker News
O Common Crawl está incluído na lista de "Providers" junto com OpenAI e Anthropic
OpenFoodFacts, OpenStreetMap e Wikipedia estão sofrendo ataques DDoS
Impedir crawling pode ser um esforço inútil
A Cloudflare oferece um serviço de proteção contra abuso de uma nova forma
Dúvidas sobre o futuro da World Wide Web
Mais detalhes podem ser vistos no blog da Cloudflare
Exemplo do Bingeclock usando o AI Audit
Próximo passo: gerar conteúdo com IA generativa e receber pagamento quando a Cloudflare escaneá-lo
Raspar repetidamente o mesmo site é um enorme desperdício