-
Ferramenta de investigação e análise de dados para jornalismo investigativo criada pela OCCRP, especializada em investigações sobre crime organizado e corrupção
-
Busca cruzada integrada de dados estruturados (DB) e não estruturados (PDF, XLS, DOC etc.)
-
Recursos de segmentação de dados e controle de acesso. Oferece compartilhamento flexível entre equipes multinacionais
-
Rastreamento contínuo a partir de centenas de fontes de dados públicas
-
Oferece análise investigativa visual
-
Suporte à importação de dados
-
Desde HTML/XML, PDF, RTF e Epub até a maior parte de documentos de escritório (Doc, PPT)
-
Formatos tabulares como XLS/CSV, além de DBF, SQLite, Access etc.
-
E-mails RFC822 MIME, caixas de correio como Outlook PST/OLM, Mbox, Vcard
-
Zip, Rar, Tar, 7Zip, Gzip
-
JPEG, PNG, GIF, TIFF, SVG com extração de texto via OCR usando Tesseract 4 ou Google Vision API
1 comentários
A organização por trás disso é a OCCRP.
"OCCRP, veículo de jornalismo investigativo especializado em crime organizado e corrupção" https://newstapa.org/article/_DNLi
Você pode testar com dados reais em https://aleph.occrp.org/.
O vídeo trailer feito pela OpenOil explica o Aleph de forma simples.
( A OpenOil é uma empresa que cria um framework de dados abertos para gerenciar recursos naturais como gás, petróleo e carvão no mundo todo. )
https://www.youtube.com/watch?v=bg96HcR_2Jc
Como foi feito por uma organização investigativa especializada em "corrupção", o modelo de dados básico é "Follow the Money".
Ele rastreia muito bem como o dinheiro circula entre empresas e pessoas.
Por isso, os tipos de entidades de conjunto de dados com suporte básico são os seguintes.