Tribunal de apelações dos EUA decide novamente que web scraping é legal

xguru · 2022-04-20T09:50:04+09:00

"Raspar dados acessíveis publicamente é legal (não viola a CFAA)" Reafirma a decisão anterior no processo movido pelo LinkedIn para proibir o scraping feito pela empresa de análise Hiq (já havia perdido em 2019) Boa notícia para o web archive, a academia, pesquisadores e jornalistas Desta vez, o tribunal dos EUA reexaminou a CFAA (Computer Fraud and Abuse Act, Lei de Fraude e Abuso de Computadores), que já existe há décadas Limitando essa violação a "pessoas que obtiveram acesso não autorizado" a sistemas de computador Em sites públicos, o conceito de "não autorizado" não se aplica

(techcrunch.com)

22 pontos por xguru 2022-04-20 | 11 comentários | Compartilhar no WhatsApp

"Raspar dados acessíveis publicamente é legal (não viola a CFAA)"
Reafirma a decisão anterior no processo movido pelo LinkedIn para proibir o scraping feito pela empresa de análise Hiq (já havia perdido em 2019)
Boa notícia para o web archive, a academia, pesquisadores e jornalistas
Desta vez, o tribunal dos EUA reexaminou a CFAA (Computer Fraud and Abuse Act, Lei de Fraude e Abuso de Computadores), que já existe há décadas
- Limitando essa violação a "pessoas que obtiveram acesso não autorizado" a sistemas de computador
- Em sites públicos, o conceito de "não autorizado" não se aplica

11 comentários

devsejong 2022-04-20

Também fico curioso se, na Coreia, web scraping não tem problemas legais.
Se alguém já teve experiência com isso, poderia compartilhar?

nullvana 2022-04-25

Pela nossa regulamentação

Informações pessoais de crédito
Isso não é “crédito” no sentido de “cartão de crédito”. Serviços que permitem ao próprio titular “consultar” dados capazes de formar uma avaliação da reputação financeira de uma pessoa (saldo, histórico de transações etc.) são proibidos. É preciso obter licença para operar como gestor de informações pessoais de crédito. Mas, se a pessoa não puder consultar diretamente e os dados forem apenas usados como material, como numa declaração de imposto, aí não há problema. Hm...?
Mesmo que você obtenha a informação desejada em uma página web por meio de crawling ou scraping, contornar uma página de pagamento, ou obter dados além daquilo que é fornecido/intencionado na tela, é tudo ilegal. Mesmo que não apareça na tela em json, ainda assim vai e volta entre FE/BE, e qualquer uso fora da intenção é ilegal. Acho que vi uma notícia de alguém que acabou preso por pegar registros públicos de graça no site do Ministério da Justiça.

Bom, o item 2 eu até entendo mais do ponto de vista de proteção, porque instituições financeiras sem dinheiro (seguradoras, administradoras de cartão, corretoras etc... fora os bancos) não têm capacidade e acabam deixando muitos buracos... mas o item 1 realmente parece uma grande trapalhada. No item 1 também dá para entender a intenção dentro da ideia de soberania dos dados pessoais, mas o jeito como estão fazendo isso parece um ActiveX 3.0?

devsejong 2022-04-21

Agradeço a todos que deixaram comentários! Isso me ajudou muito.

ninebow 2022-04-21

Estou compartilhando um link de uma newsletter que assino, que abordou um tema semelhante há pouco tempo.

Junto com o caso JobKorea vs. Saramin mencionado abaixo pelo rtyuiop, há também um resumo dos casos Yeogi Eottae vs. Yanolja e Naver vs. Darwin Brokerage.
https://stibee.com/api/v1.0/…==

xguru 2022-04-21

Ah, essa newsletter da Packple News é muito boa. Obrigado pelo link~!

ninebow 2022-04-21

Sempre acompanho com gratidão (_ _)

rtyuiop 2022-04-20

Pelo que eu sei, o caso mais conhecido aqui é o de quando a Yeogi Eottae fez crawling dos dados da Yanolja. Pelo que entendi, eram dados públicos e, claro, não havia problema com o crawling em si, mas os principais pontos em discussão eram (1) o prejuízo sofrido pela Yanolja devido ao aumento da carga no servidor e (2) o prejuízo que a Yanolja poderia sofrer por serem duas marcas do mesmo setor. Como a ação ainda está em andamento e cada matéria interpreta o caso de um jeito diferente, acho melhor você ler várias coisas diretamente.

tingo29 2022-04-20

No setor financeiro, o scraping foi proibido desde o início do MyData.

https://news.einfomax.co.kr/news/articleView.html?idxno=4192027

tribela 2022-04-20

Já conversei sobre isso com um advogado que conheço e, na época, a interpretação era: "reunir informações publicamente disponíveis em si não é um problema, mas se existir algum tipo de mecanismo para impedir o crawling, o momento em que você tenta contorná-lo para armazenar os dados pode se tornar problemático".
No fim das contas, no direito eles acabam olhando mais para a intenção do que para a questão técnica.

xguru 2022-04-20

Como se trata de informações de perfis pessoais no LinkedIn, isso dá uma sensação meio estranha... Mas realmente parece difícil proibir scraping até mesmo de informações que estão disponíveis publicamente.

Situação do web scraping em 2021

joone 2022-04-26

Há muitas informações públicas no LinkedIn. Ainda assim, o LinkedIn é um dos sites mais difíceis de fazer scraping. Mas, de um jeito ou de outro, acabam coletando as páginas. É uma luta entre espada e escudo.

Tribunal de apelações dos EUA decide novamente que web scraping é legal

Leituras relacionadas

11 comentários