7 pontos por xguru 2020-03-02 | 1 comentários | Compartilhar no WhatsApp
  • Ferramenta de investigação e análise de dados para jornalismo investigativo criada pela OCCRP, especializada em investigações sobre crime organizado e corrupção

  • Busca cruzada integrada de dados estruturados (DB) e não estruturados (PDF, XLS, DOC etc.)

  • Recursos de segmentação de dados e controle de acesso. Oferece compartilhamento flexível entre equipes multinacionais

  • Rastreamento contínuo a partir de centenas de fontes de dados públicas

  • Oferece análise investigativa visual

  • Suporte à importação de dados

  • Desde HTML/XML, PDF, RTF e Epub até a maior parte de documentos de escritório (Doc, PPT)

  • Formatos tabulares como XLS/CSV, além de DBF, SQLite, Access etc.

  • E-mails RFC822 MIME, caixas de correio como Outlook PST/OLM, Mbox, Vcard

  • Zip, Rar, Tar, 7Zip, Gzip

  • JPEG, PNG, GIF, TIFF, SVG com extração de texto via OCR usando Tesseract 4 ou Google Vision API

1 comentários

 
xguru 2020-03-02

A organização por trás disso é a OCCRP.

"OCCRP, veículo de jornalismo investigativo especializado em crime organizado e corrupção" https://newstapa.org/article/_DNLi

Você pode testar com dados reais em https://aleph.occrp.org/.

O vídeo trailer feito pela OpenOil explica o Aleph de forma simples.

( A OpenOil é uma empresa que cria um framework de dados abertos para gerenciar recursos naturais como gás, petróleo e carvão no mundo todo. )

https://www.youtube.com/watch?v=bg96HcR_2Jc

Como foi feito por uma organização investigativa especializada em "corrupção", o modelo de dados básico é "Follow the Money".

Ele rastreia muito bem como o dinheiro circula entre empresas e pessoas.

Por isso, os tipos de entidades de conjunto de dados com suporte básico são os seguintes.

  • Airplane, Assessment, Asset, Bank Account, Company, Contract, Court case, Customs Declaration, Land, Legal Entity