- Corretoras de dados estão vendendo informações pessoais relacionadas a voos para a Alfândega dos EUA (CBP) e o Serviço de Imigração e Fiscalização Aduaneira (ICE)
- Foi revelado recentemente que a Airlines Reporting Corporation (ARC) reúne registros de viajantes e os compartilha com órgãos governamentais
- As informações são vendidas sem o consentimento dos usuários, o que levanta problemas de privacidade e de contorno de direitos constitucionais
- Dados sensíveis de localização, histórico de uso da internet e dados de serviços públicos também estão sendo agregados de forma semelhante e repassados a órgãos de segurança pública
- Para enfrentar esse problema, cresce a necessidade de leis robustas de proteção à privacidade, como os projetos
Privacy First e Fourth Amendment is Not For Sale
O problema das corretoras de dados e da venda de informações pessoais
- Há muito tempo as corretoras de dados exploram brechas nas leis de proteção de dados pessoais para coletar informações dos usuários
- Elas vendem dados sensíveis, como informações de localização, sem o nosso consentimento, e entre seus principais clientes estão agências de aplicação da lei
- Esse mercado de dados funciona de forma que qualquer um que colete dados pessoais pode lucrar com isso, o que também o torna atraente para órgãos governamentais que desejam contornar a lei
O caso da venda de dados de voos pela ARC
- Segundo revelações da 404 Media e de outros veículos, a Airlines Reporting Corporation (ARC) é uma corretora de dados pertencente e operada por pelo menos 8 grandes companhias aéreas dos EUA
- Ela coleta dados sensíveis de passagens aéreas, como listas de passageiros, itinerários completos de viagem e detalhes de pagamento, de empresas como United Airlines e American Airlines, e os vende secretamente para a Alfândega dos EUA (CBP)
- As corretoras de dados chegam a usar métodos para ocultar a origem das informações, impedindo que órgãos do governo divulguem a procedência desses dados
- Em outras palavras, isso permite que o governo acesse informações sem mandado ou outros procedimentos judiciais e, ao esconder a origem, aprofunda a invasão de privacidade e o contorno de direitos
Travel Intelligence Program (TIP) e seus impactos
- O Travel Intelligence Program (TIP) da ARC agrega mais de 1 bilhão de registros de viagens aéreas ao longo de 39 meses, incluindo passado e futuro
- Em relatório interno, a CBP afirmou que precisa dessas informações para ajudar a identificar pessoas de interesse para polícias locais e estaduais
- No entanto, em um contexto nos EUA de aumento da fiscalização imigratória e de abordagens e buscas injustificadas, cresce o risco de que essas informações passem a lançar suspeita também sobre viajantes inocentes
A influência da ARC e a participação das companhias aéreas
- Por meio da ARC, são processadas mais de 54% das informações de voos do mundo, com a participação de mais de 200 companhias aéreas nessa rede
- O conselho inclui representantes de companhias aéreas dos EUA e internacionais, como JetBlue, Delta, Lufthansa, Air France e Air Canada
- Ao vender em massa informações sensíveis para órgãos de aplicação da lei, as companhias aéreas demonstram priorizar a receita acima da privacidade individual
- Foi revelado recentemente que o ICE de fato comprou dados pessoais de viajantes da ARC
Efeitos mais amplos e situação atual da violação de privacidade
- Embora a liberdade de circulação seja um elemento central de uma sociedade democrática, corretoras de dados como a ARC estão criando silenciosamente um ambiente em que é possível rastrear históricos de viagem
- Em um momento em que cresce nos EUA o debate sobre a possibilidade de prejuízos legais com base em nacionalidade, religião ou orientação política, o uso dos dados da ARC traz o risco de abuso de poder por parte do Estado
- Além de informações aéreas, as corretoras de dados também vendem dados de localização de smartphones, dados de backbone da internet e registros de serviços públicos, ampliando o alcance das violações de privacidade
Exigências de política pública e soluções
- Num momento em que autoridades governamentais vêm ampliando medidas que enfraquecem liberdades e direitos em fronteiras e outros contextos, esse volume massivo de coleta e venda de dados gera preocupação ainda maior
- O caso da ARC reforça a necessidade de projetos de lei voltados à privacidade em primeiro lugar, como o
Privacy First, e de regras que consagrem o princípio de minimização no tratamento de dados pelas empresas
- Também cresce a defesa da aprovação do projeto
Fourth Amendment is Not For Sale, para impedir que órgãos de aplicação da lei contornem a exigência de mandado ao comprar informações de corretoras de dados
- Por fim, regulação das corretoras de dados, incluindo registro obrigatório e maior transparência, também surge como tarefa urgente
1 comentários
Comentário do Hacker News
Muita gente não percebe como é fácil construir esse tipo de modelo de dados mesmo sem acesso privilegiado a dados primários. Em 2012, um protótipo que eu fiz mostrou que era possível rastrear com precisão, em grande escala, o histórico de voos da maioria das pessoas usando apenas dados de redes sociais ou publicidade. Isso já era possível há muito tempo. O método geral era filtrar, em um grafo de entidades, as arestas espaço-temporais abaixo de 300 km/h ou de 200 km de distância. Com esse critério, dava para inferir se alguém havia “embarcardo em um avião” e também descobrir origem e destino. Se você ligar essas arestas a dados públicos de voos ou a dados IoT de manutenção de motores a jato, dá até para casar com voos específicos. A maioria das pessoas subestima como dados industriais IoT totalmente comuns podem ser usados para inferir relações em outros domínios. Raramente havia casos em que múltiplos voos eram possíveis ao mesmo tempo, mas se você escolhesse a principal companhia aérea usada no passado com base no histórico de voos anterior, quase sempre batia perfeitamente. Funcionava de forma impressionante, e não exigia nenhum dado primário de companhia aérea nem análise sofisticada. No fim das contas, tempo e espaço são a chave primária da realidade
Ao ler a explicação sobre “selecionar rotas com possibilidade de voo”, parece que a essência do problema é, no fim, quem tem os “dados espaço-temporais” desde o começo. No fundo, isso não é muito diferente de dizer “se eu tiver o histórico do seu cartão de crédito, posso saber quando, onde e em que loja você esteve”. É assustador, mas o realmente grave é o fato de esse acesso aos dados ser possível. Se alguém já conhece toda a sua localização aproximada ao longo do tempo, esse dado espaço-temporal em si tem muito mais valor do que um histórico individual de embarques em aviões
O que acho interessante é que as pessoas se preocupam com a possibilidade de coletarem e abusarem de vários dados pessoais, mas na maior parte do tempo o que fazem com isso é só mostrar mais anúncios personalizados
De onde alguém tira uma coisa como “dados IoT de manutenção de motores a jato”, afinal?
Imagino que a ICE precise desse tipo de dado para rastrear quando uma pessoa específica visitou determinada cidade ou país
Acho curioso descrever a ARC apenas como uma “corretora de dados”. Na prática, a ARC e a IATA funcionam como câmaras de compensação de pagamentos de passagens aéreas e também mantêm/supervisionam sistemas do setor relacionado. Por natureza, os dados brutos de transação chegam até elas, e elas lucram vendendo isso. Mas isso não é uma estrutura como a de outros data brokers, que coletam dados de fora e os revendem; elas próprias possuem dados primários. A questão fundamental é se deveria ser permitido vender ou compartilhar esse tipo de dado sensível e não anonimizado, mas, de todo modo, trata-se de dados primários na raiz. Também vale ver a explicação completa da estrutura da Airline Reporting Corporation
A quantidade e o alcance dos dados vendidos por corretores são muito maiores do que se imagina. Mesmo que você pense no pior cenário, a realidade é umas dez vezes pior
Um colega meu certa vez exibiu um banner de imagem direcionado a uma pessoa específica com a frase “eu te disse que conseguia fazer até isso, amigo!”, só para demonstrar o efeito. As pessoas comuns quase não têm ideia de quanto as empresas de publicidade e os corretores de dados sabem sobre elas
Por volta de 2014, quando eu trabalhava com recrutadores, vi ferramentas que raspavam informações das pessoas de LinkedIn, Yelp, Twitter, GitHub, Eventbrite etc. Já naquela época era possível reunir um volume tão grande de dados que dava para mapear mais de 10 anos de histórico. Trabalhando com empresas como a Palantir, parece plausível que o governo consiga até fazer análise de estilo ou perfil psicológico com posts do Reddit
Tenho uma ideia de projeto artístico que precisa desse tipo de perfil de dados; agradeceria recomendações de boas fontes onde isso possa ser comprado barato. Como o projeto é enorme, nem sei por onde começar
Como alguém que trabalha nesse setor, minha sensação é de que a situação é “mil vezes pior” na prática
Acho que a maioria dos usuários do HN quase não entende como o setor realmente funciona. Talvez seja preciso reformular completamente a direção da discussão. A maioria acha que, no máximo, o Google vende seus dados pessoais, mas o setor de dados real é muito mais frouxo em controles. Por exemplo, é fácil a ponto de você poder ligar e pedir, de um dia para o outro, o histórico de transações de cartão de crédito de um dentista de bairro de 35 anos, formatado exatamente do jeito que você quiser, filtrando só aquela pessoa
É impressionante como o mercado de dados fica tão escondido. Inúmeras grandes empresas extraem e negociam dados diariamente, mas, mesmo com toda essa onda barulhenta de “descentralização”, não existe um marketplace de dados realmente aberto. Eu sempre quis ver surgir um modelo em que até dados comportamentais abertos pudessem ser comprados e vendidos, e em que as pessoas deixassem de ser apenas “produto” para passarem a fornecer dados às empresas em troca de pagamento
Na prática, não acho que isso fique tão escondido assim. Em 2021, houve um caso de uma pessoa que foi à casa de outra para acertar uma vingança de 50 anos, e ela apareceu em vídeo de CCTV carregando uma pasta do PeopleFinders. O mais surpreendente é que até órgãos do governo vendem esse tipo de dado
Em vez de tentar extrair ainda mais desse modelo de receita, acho que o certo seria simplesmente fechar tudo e parar
Não entendo por que a CBP e a ICE precisam comprar informações de corretores de dados. A TSA já escaneia o cartão de embarque de todo mundo de qualquer forma
Provavelmente há regras e procedimentos rígidos para acessar os dados coletados pela TSA, enquanto comprar praticamente a mesma informação de um corretor quase não exige nada. A fonte dos dados também pode não ser a TSA, mas companhias aéreas, processadoras de pagamento etc. A qualidade dos dados do corretor pode não ser garantida, mas o processo é muito mais simples
Quando eu trabalhava em um órgão federal, até para coletar tweets públicos eu precisava documentar por que isso era necessário, quais dados pessoais seriam armazenados, por quanto tempo seriam mantidos e como seriam apagados, além de obter aprovação direta. Coisas que qualquer pessoa comum pode fazer no fim de semana exigem uma montanha de aprovações dentro do governo. Mas, se você quiser pedir dados de outro órgão? Aí a carga política fica literalmente inimaginável. Mesmo sendo um órgão parceiro, não é fácil, e cheguei a receber conselho de que até mencionar esse tipo de pedido a outro órgão em reunião só criaria atrito desnecessário. Por outro lado, se você comprar de um corretor de dados, não precisa passar por toda essa complicação
Talvez também seja porque a TSA não distribui autorizações assim tão facilmente. É parecido com a situação em que a polícia precisa de mandado para pedir dados de um celular, mas uma operadora vende a localização em tempo real a um terceiro e a polícia pode simplesmente comprar isso. Link de referência
O governo usa empresas para driblar leis e a Constituição, e as empresas usam o governo para escapar de regulação. É uma estrutura antiga
Além dos motivos legais e regulatórios, dentro da organização é mais difícil e mais caro construir e coordenar fluxos de dados práticos que vários departamentos possam usar do que simplesmente comprar de um corretor que já é otimizado para curadoria, gestão e distribuição de dados. Por mais absurdo que pareça, no fim das contas os dados do corretor, mesmo com preço premium, dão menos dor de cabeça e passam mais confiança. A equipe técnica da TSA não tem incentivo para anexar metadados aos dados e ainda gerenciar SLA. O corretor de dados sempre tem esse incentivo
yaelwrites/Big-Ass-Data-Broker-Opt-Out-List é uma boa lista para começar a fazer opt-out de corretores de dados. Mas a ARC citada no artigo não está nela neste momento
Isso foge um pouco do tema, mas queria saber se alguém tem estimativas aproximadas de quanto empresas comuns (tirando as de publicidade) realmente lucram vendendo dados de consumidores e padrões de comportamento
Houve uma discussão relacionada no HN há cerca de dois meses, e também outra thread
Este caso é interessante porque, no passado, corretores particularmente predatórios ignoravam multas da GDPR por não terem base operacional na UE, ou simplesmente aceitavam o risco porque o lucro era muito maior (como a Clearview). Mas, para empresas como companhias aéreas, cujo negócio principal tem margens baixas e receita global elevada, violar a GDPR é muito mais fatal. Se a companhia aérea for a controladora dos dados, o simples fornecimento ao corretor já pode ser ilegal, e como ela está muito exposta à UE, também é difícil escapar de multa. Em casos extremos, um Estado-membro pode até apreender a própria aeronave ou tentar banir todas as operações. A Alemanha já apreendeu o avião de um príncipe tailandês na prática. Link da matéria relacionada
Tenho curiosidade de saber que tipo de informação eu poderia obter sobre mim mesmo e outras pessoas de um corretor de dados, pagando por isso. Alguém sabe como acessar esse tipo de corretor de dados?