Introdução ao en.osm.town
- O en.osm.town faz parte de uma rede social descentralizada baseada em Mastodon
- É uma comunidade independente da comunidade OpenStreetMap e recebe financiamento da OpenStreetMap Foundation
- Estatísticas do servidor: 257 usuários ativos
Principais pontos
- Grant Slater propõe às empresas de IA que, em vez de fazer scraping oculto dos dados do OpenStreetMap, façam uma doação de US$ 10.000
- Com uma doação de US$ 50.000, também seria possível oferecer atualizações em streaming em tempo real
- Bart Louwers menciona que o scraping do OpenStreetMap é algo comum
- wikiyu argumenta que usar os dados do planet.osm é mais eficiente
- Josua critica o fato de a IA estar sendo treinada de maneira ineficiente
- Juan Luis menciona que um problema semelhante de abuso por crawlers de IA também está acontecendo no Read the Docs
- Simon Poole afirma que uma abordagem razoável pode prejudicar a imagem das empresas de IA
- Michał levanta a possibilidade de que contratados de determinados países tenham recebido a tarefa de baixar dados do OSM
- leadingzero critica o fato de que os requisitos de licença do OSM não estão sendo devidamente aplicados
- Grant Slater menciona que criou um repositório no GitHub para rastrear atributos de tiles
- Guillaume Rischard menciona que recentemente resolveu uma questão jurídica na Alemanha
- Adderall girl grindset (Jes) propõe bloquear crawlers de IA
Resumo do GN⁺
- Este texto trata do problema das empresas de IA que fazem scraping de dados do OpenStreetMap
- Sugere formas mais eficientes de usar os dados do OpenStreetMap e uma abordagem de acesso aos dados por meio de doações
- Discute o problema do abuso por crawlers de IA e possíveis formas de resposta
- Projetos com funcionalidades semelhantes incluem Google Maps e Bing Maps
1 comentários
Opinião do Hacker News
robots.txt, não usam a API pública e não respeitam carga de pico, aumentando os custos de infraestruturadocker runplanet.osmem torrent e permitir scraping apenas via torrent poderia distribuir a carga de rede