- "Raspar dados acessíveis publicamente é legal (não viola a CFAA)"
- Reafirma a decisão anterior no processo movido pelo LinkedIn para proibir o scraping feito pela empresa de análise Hiq (já havia perdido em 2019)
- Boa notícia para o web archive, a academia, pesquisadores e jornalistas
- Desta vez, o tribunal dos EUA reexaminou a CFAA (Computer Fraud and Abuse Act, Lei de Fraude e Abuso de Computadores), que já existe há décadas
- Limitando essa violação a "pessoas que obtiveram acesso não autorizado" a sistemas de computador
- Em sites públicos, o conceito de "não autorizado" não se aplica
11 comentários
Também fico curioso se, na Coreia, web scraping não tem problemas legais.
Se alguém já teve experiência com isso, poderia compartilhar?
Pela nossa regulamentação
Informações pessoais de crédito
Isso não é “crédito” no sentido de “cartão de crédito”. Serviços que permitem ao próprio titular “consultar” dados capazes de formar uma avaliação da reputação financeira de uma pessoa (saldo, histórico de transações etc.) são proibidos. É preciso obter licença para operar como gestor de informações pessoais de crédito. Mas, se a pessoa não puder consultar diretamente e os dados forem apenas usados como material, como numa declaração de imposto, aí não há problema. Hm...?
Mesmo que você obtenha a informação desejada em uma página web por meio de crawling ou scraping, contornar uma página de pagamento, ou obter dados além daquilo que é fornecido/intencionado na tela, é tudo ilegal. Mesmo que não apareça na tela em
json, ainda assim vai e volta entre FE/BE, e qualquer uso fora da intenção é ilegal. Acho que vi uma notícia de alguém que acabou preso por pegar registros públicos de graça no site do Ministério da Justiça.Bom, o item 2 eu até entendo mais do ponto de vista de proteção, porque instituições financeiras sem dinheiro (seguradoras, administradoras de cartão, corretoras etc... fora os bancos) não têm capacidade e acabam deixando muitos buracos... mas o item 1 realmente parece uma grande trapalhada. No item 1 também dá para entender a intenção dentro da ideia de soberania dos dados pessoais, mas o jeito como estão fazendo isso parece um ActiveX 3.0?
Agradeço a todos que deixaram comentários! Isso me ajudou muito.
Estou compartilhando um link de uma newsletter que assino, que abordou um tema semelhante há pouco tempo.
Junto com o caso JobKorea vs. Saramin mencionado abaixo pelo rtyuiop, há também um resumo dos casos Yeogi Eottae vs. Yanolja e Naver vs. Darwin Brokerage.
https://stibee.com/api/v1.0/…==
Ah, essa newsletter da Packple News é muito boa. Obrigado pelo link~!
Sempre acompanho com gratidão (_ _)
Pelo que eu sei, o caso mais conhecido aqui é o de quando a Yeogi Eottae fez crawling dos dados da Yanolja. Pelo que entendi, eram dados públicos e, claro, não havia problema com o crawling em si, mas os principais pontos em discussão eram (1) o prejuízo sofrido pela Yanolja devido ao aumento da carga no servidor e (2) o prejuízo que a Yanolja poderia sofrer por serem duas marcas do mesmo setor. Como a ação ainda está em andamento e cada matéria interpreta o caso de um jeito diferente, acho melhor você ler várias coisas diretamente.
No setor financeiro, o scraping foi proibido desde o início do MyData.
https://news.einfomax.co.kr/news/articleView.html?idxno=4192027
Já conversei sobre isso com um advogado que conheço e, na época, a interpretação era: "reunir informações publicamente disponíveis em si não é um problema, mas se existir algum tipo de mecanismo para impedir o crawling, o momento em que você tenta contorná-lo para armazenar os dados pode se tornar problemático".
No fim das contas, no direito eles acabam olhando mais para a intenção do que para a questão técnica.
Como se trata de informações de perfis pessoais no LinkedIn, isso dá uma sensação meio estranha... Mas realmente parece difícil proibir scraping até mesmo de informações que estão disponíveis publicamente.
Situação do web scraping em 2021
Há muitas informações públicas no LinkedIn. Ainda assim, o LinkedIn é um dos sites mais difíceis de fazer scraping. Mas, de um jeito ou de outro, acabam coletando as páginas. É uma luta entre espada e escudo.