auto-identity-remove - executor automático de opt-out de corretores de dados para macOS, Linux e Windows
(github.com/stephenlthorn)- auto-identity-remove é uma ferramenta que pesquisa sites de corretores de dados com nome e informações de localização e envia automaticamente formulários de opt-out, ajudando a remover informações pessoais de mais de 500 sites de busca de pessoas e bases de dados de corretores de dados todos os meses
- O fluxo de execução é composto por pesquisa por corretor, detecção de listas de perfis específicos, envio do formulário de opt-out, resolução de CAPTCHA quando necessário, ignorar itens concluídos recentemente, notificação de resultados e abertura no navegador dos sites que exigem processamento manual
- O rastreamento de estado salva no
state.jsono último momento de sucesso e o histórico de execução, e o ciclo padrão de reverificação é de 90 dias, para não reenviar opt-outs já concluídos a cada execução - Formulários com CAPTCHA podem ser processados via CapSolver, com custo aproximado de $0.001 por resolução; se não estiver configurado, o site correspondente vai para a lista de processamento manual
- Os requisitos são Node.js 18+, macOS, Linux ou Windows, e os navegadores do Playwright; o
setup.jsorienta sobre inserção de dados pessoais, aliases, chave do CapSolver, conta descartável, notificações e registro de agendamento mensal - A tarefa mensal é registrada para executar todo dia 1 às 9h da manhã e, dependendo da plataforma, usa detecção automática de launchd, systemd, crontab ou schtasks
- Também há suporte para execução com Docker, usando a imagem oficial do Playwright com Chromium e dependências do sistema incluídas; para manter o histórico de conclusão entre contêineres, é necessário montar o
state.json - As notificações oferecem suporte ao resumo de resultados via iMessage no macOS e, em ambientes headless ou Docker, é possível fazer POST de
{"text": "<summary>"}para ntfy.sh, Slack incoming webhook ou Discord webhook comnotify.webhook - O suporte a corretores é dividido em duas etapas e os 42 corretores explícitos listados em STATUS.md são mapeados com seletores individuais, enquanto cerca de 490 são tratados por uma abordagem heurística que tenta, em sequência, botão Do Not Sell, OneTrust, TrustArc, Osano, formulários genéricos e busca por links DSAR
✅ Submittedsignifica apenas que o corretor recebeu o formulário, não que a exclusão esteja garantida;node watcher.js --verifypesquisa novamente os itens registrados como sucesso e os classifica emVERIFIED CLEAR,STILL LISTEDeUNVERIFIABLE- Entre os principais alvos com processamento automático suportado estão Spokeo, WhitePages, FastPeopleSearch, TruePeopleSearch, BeenVerified, Radaris, Acxiom, LexisNexis, ZoomInfo e Clearbit; Google Results About You e Google Outdated Content são abertos para processamento manual
- Usuários fora dos EUA têm suporte a código do país, Province/Region, Postal code, armazenamento do número de telefone original e preenchimento de campos de seleção de país, mas corretores somente dos EUA como Spokeo, WhitePages e FastPeopleSearch são ignorados automaticamente se o país configurado não for
US --dry-runapenas navega pelos sites e preenche os formulários, sem enviar nada, e o recurso experimental--pollute Nenvia registros falsos para alguns corretores marcados comacceptsBogus: true, mas vem desativado por padrão porque o texto explicita possível violação de termos e risco legalconfig.json, que contém informações pessoais, o histórico de opt-out emstate.jsone os logs de execução estão no gitignore, e a licença do repositório é MIT
1 comentários
Comentários do Hacker News
A parte em que preciso de ajuda é que a abordagem heurística deixa muita coisa passar. Muitos sites têm fluxos próprios, então quatro estratégias genéricas não dão conta
Preciso de alguém para validar quais sites genéricos realmente funcionam e quais falham silenciosamente, adicionar definições explícitas de brokers para os sites mais importantes, testar fora do macOS e lidar com fluxos de verificação por e-mail
Repo: https://github.com/stephenlthorn/auto-identity-remove
O repositório não contém dados pessoais; o script de configuração coleta as informações localmente e as deixa no
gitignorePara a verificação por e-mail, talvez dê para improvisar avisando “clique no link de confirmação em um e-mail deste remetente”. Ler uma caixa de entrada real de forma confiável em vários provedores pode ser difícil, porque isso praticamente exigiria um cliente de e-mail
E talvez eu esteja enganado, mas este próprio comentário também parece ter sido gerado por IA. Se for o caso, isso viola as diretrizes do site
A ideia é boa, mas ainda precisa de muitos ajustes para ser útil de forma geral. CEPs alfanuméricos e endereços fora dos EUA parecem quebrar bastante da automação
Conversando com colegas, vimos que o formulário de opt-out só exigia o endereço. Pensei em pegar todos os endereços conhecidos do país e automatizar envios ao longo de alguns meses para remover todos, mas isso nunca foi adiante; ainda assim, eu ria imaginando em que percentual de opt-outs os desenvolvedores da Yellow Pages teriam feito uma reunião de emergência
Os entregadores não estavam dando conta e acabaram começando a empilhar e queimar os montes de listas. Como ninguém sentia falta delas, demorou bastante até serem pegos
Já me esforcei bastante para impedir que a Uline enviasse catálogos gigantes de papel para uma caixa postal duas ou três vezes por ano. Existe um formulário, mas eles simplesmente ignoram o pedido
https://www.uline.com/CustomerService/ULINE_FAQ_Ans?FAQ_ID=4...
Isso não quer dizer que ainda não aconteça, mas dá base jurídica para reagir. noyb.eu / Max Schrems e outros estão fazendo um trabalho excelente e muito importante nessa frente
O reCAPTCHA v3 Enterprise e o MtCaptcha custam 3 vezes mais, $3 por 1000 soluções. Então parecem ser CAPTCHAs mais interessantes para mirar
Suporte a systemd parece fácil. No Windows, não sei bem o que se usa
Ainda assim, com o Agendador de Tarefas dá para programar execuções mensais e várias outras coisas
sc.exeou taskschedO modelo de ameaça é meio ambíguo: a ferramenta pode reduzir a exposição, mas um seletor quebrado também pode vazar dados pessoais para o lugar errado
Uma solução muito melhor seria aprovar alguma lei estilo GDPR nos EUA
Para consumidores, ele já está disponível. Você pode se cadastrar junto com seus 275 mil vizinhos