- Artigo sobre a complexidade jurídica e a hipocrisia em torno do web scraping
- Como grandes empresas como Meta e Microsoft proíbem o web scraping em suas próprias plataformas, enquanto ao mesmo tempo coletam dados de plataformas de outras empresas
- A complexidade das questões legais sobre acessar e usar dados na internet, bem como sobre a finalidade desse uso. Existem formas de dados protegidas por direitos autorais ou outras formas de propriedade intelectual, mas a maior parte dos dados da internet não recebe proteção com facilidade
- Empresas de mídia social como LinkedIn e Facebook são as que mais agressivamente movem ações contra web scraping. No entanto, o conteúdo que elas dizem proteger foi gerado pelos usuários e não é propriedade delas
- Nos primórdios da internet, as empresas usavam teorias jurídicas para tentar impedir o web scraping como se fosse uma invasão de bens. Ou seja, argumentavam que solicitações massivas e indesejadas de dados constituíam uma forma de invasão à propriedade física de alguém, isto é, aos servidores de computador
- Do início dos anos 2000 até 2017, o Computer Fraud and Abuse Act (CFAA) foi a principal base jurídica para impedir o web scraping. O CFAA proíbe acesso não autorizado a um "computador protegido"
- No caso hiQ Labs, Inc. v. LinkedIn Corp., de 2017, foi reconhecido o direito de um scraper de acessar dados públicos do LinkedIn sob o CFAA, o que levou muitos a interpretar isso como um direito positivo de fazer scraping de dados públicos
- Atualmente, a principal forma de barrar o web scraping é por meio de alegações de violação contratual. Isso permite que empresas reivindiquem, via direito contratual, direitos de propriedade sobre o uso e o acesso aos dados
- A mudança do direito de propriedade para o direito contratual permite que donos de sites definam seus direitos sobre dados online por meio de termos de uso online
- O artigo destaca a hipocrisia de empresas como a Microsoft. Recentemente, ela atualizou os termos de uso para proibir scraping de serviços de IA, mas sua afiliada OpenAI lançou produtos projetados para fazer scraping da internet inteira
- O autor critica o fato de os tribunais permitirem que empresas privadas criem direitos de propriedade intelectual por meio de contratos de adesão, argumentando que essas decisões deveriam ser tratadas como questões de interesse público
- O artigo sugere que o atual regime jurídico do web scraping será testado pelos casos de IA generativa, prevendo que a coerência da lei não poderá ser mantida e que haverá desenvolvimentos jurídicos importantes nos próximos anos
1 comentários
Comentários do Hacker News