- Arquivo aberto de informações que estrutura os dados do CIA World Factbook de 1990 a 2025 para permitir busca e análise
- Inclui 281 países e territórios, 36 edições anuais e mais de 1 milhão de campos de dados
- Oferece perfis de países por ano, dados de séries temporais, busca textual completa e análise de redes de geografia, comunicações e comércio
- Inclui ferramentas de análise como dashboard baseado em regiões COCOM, comparação de indicadores entre países e visualização de tendências globais
- Baseado em material de domínio público e é um projeto independente sem vínculo com a CIA ou o governo dos EUA
Visão geral
- Arquivo de dados que preserva e estrutura informações geopolíticas de 36 anos
- Baseado em materiais extraídos do CIA World Factbook original
- Inclui 281 entidades, 36 edições, 9.500 registros país-ano e 1.061.341 campos de dados
- Todos os dados são pesquisáveis, permitindo acompanhar mudanças nos relatórios de cada país ao longo dos anos
Estrutura da plataforma
- Factbook Archive / Reference Library
- Permite consultar todas as edições de 1990 a 2025
- Exibe os dados de campos originais como estão e permite pesquisar mudanças por ano
- Intelligence Analysis / Analytic Workspace
- Workspace analítico organizado por regiões dos Comandos Combatentes do DoD (COCOM)
- Oferece mapas coropléticos (choropleth), comparações de séries temporais, dossiês analíticos por país (formato ICD 203) e comparação entre indicadores
Principais recursos
- Library: classifica todas as entidades por tipo, incluindo bandeiras
- Country Profile: visualização de todos os campos de dados de cada país
- Full-Text Search: busca por palavras-chave em mais de 1 milhão de campos com sintaxe Z39.58
- Field Time Series: acompanhamento da evolução de um campo de dados específico ao longo de 36 anos
- Factbook Quiz: quiz de conhecimentos mundiais com 4 modos
- Factbook Export: geração de relatórios de país prontos para impressão com todos os campos
Ferramentas de análise de inteligência
- Regional Dashboard: mapa-múndi com regiões COCOM e capitais marcadas
- Timeline Map: visualização animada de 36 anos de dados
- Communications Analysis: exibição de indicadores de penetração de internet, celular e banda larga
- Map Compare: comparação sincronizada de mapas de dois anos
- COCOM Region Detail: exibição de principais indicadores (KPI) por região
- Intelligence Dossier: dossiê analítico por país com base no padrão ICD 203
- Global Rankings: ordenação do ranking de países por indicador
- Global Trends: tendências globais de indicadores ao longo de todas as edições
- Compare Countries: comparação de indicadores entre países
- Field Explorer: exploração de todos os campos de dados e estatísticas de cobertura
- Change Detection: detecção de mudanças em campos por ano
- Dissolved States: informações sobre países e territórios que já não existem
- Trade Networks: grafo de rede de relações comerciais
- Organization Networks: grafo de relações de filiação a organizações internacionais
- Query Builder: criação de consultas analíticas personalizadas
- Text Diff: comparação de textos por ano e destaque de alterações
Informações do projeto
- Todos os dados foram coletados de material de domínio público do governo dos EUA (CIA World Factbook)
- Sem relação com a CIA ou com o governo dos EUA
- As análises seguem os padrões analíticos ICD 203
- Código-fonte e metodologia estão disponíveis no repositório do GitHub
1 comentários
Comentários no Hacker News
Seria muito legal se o próximo governo reconstruísse isso usando esses dados arquivados
Alguém publica um projeto, a comunidade encontra bugs em tempo real, e o autor corrige na hora
O problema de conflito entre códigos de país FIPS e ISO é um ótimo exemplo de como esses bugs raros só podem ser encontrados com muitos olhos
Foi impressionante ver que o autor não ficou na defensiva e respondeu ativamente ao feedback
Ele é descrito como um “cache do conjunto de dados de perfis de países no formato original (1:1) do CIA.gov”
Os dados detalhados podem ser vistos em cache.factbook.json
Mas achei que era necessário transformar os dados de 1990 a 2025 em um banco de dados SQL para permitir consultas
Esse conjunto de dados é excelente para testar funcionalidades de GraphRAG
Também parece dar para criar um jogo de simulação mundial baseado em dados reais
O conteúdo original publicado pela CIA é mantido como está, e apenas o ruído de formatação é limpo durante o parsing
Além disso, criei uma tabela de consulta para mapear os códigos FIPS 10-4, ISO Alpha-2/3 e o MasterCountryID, permitindo conectá-los entre si
Também vou adicionar esses materiais ao GitHub
Ao clicar em “Germany” no Factbook de 2002, você é levado toda vez para a página de “Gambia”
Não vi esse comportamento com outros países
Link da Amazon
Dá para ver isso na página de análise de tendências
Obrigado pelo aviso!
Exemplo: dados de assinaturas de banda larga fixa da Índia
Por exemplo, “18.17 million” estava sendo interpretado apenas como 18.17, causando uma queda brusca no gráfico
Adicionei o tratamento de unidades, corrigi o bug e acabei de fazer o deploy
Obrigado por reportar