4 pontos por GN⁺ 2026-02-23 | 1 comentários | Compartilhar no WhatsApp
  • Arquivo aberto de informações que estrutura os dados do CIA World Factbook de 1990 a 2025 para permitir busca e análise
  • Inclui 281 países e territórios, 36 edições anuais e mais de 1 milhão de campos de dados
  • Oferece perfis de países por ano, dados de séries temporais, busca textual completa e análise de redes de geografia, comunicações e comércio
  • Inclui ferramentas de análise como dashboard baseado em regiões COCOM, comparação de indicadores entre países e visualização de tendências globais
  • Baseado em material de domínio público e é um projeto independente sem vínculo com a CIA ou o governo dos EUA

Visão geral

  • Arquivo de dados que preserva e estrutura informações geopolíticas de 36 anos
    • Baseado em materiais extraídos do CIA World Factbook original
    • Inclui 281 entidades, 36 edições, 9.500 registros país-ano e 1.061.341 campos de dados
  • Todos os dados são pesquisáveis, permitindo acompanhar mudanças nos relatórios de cada país ao longo dos anos

Estrutura da plataforma

  • Factbook Archive / Reference Library
    • Permite consultar todas as edições de 1990 a 2025
    • Exibe os dados de campos originais como estão e permite pesquisar mudanças por ano
  • Intelligence Analysis / Analytic Workspace
    • Workspace analítico organizado por regiões dos Comandos Combatentes do DoD (COCOM)
    • Oferece mapas coropléticos (choropleth), comparações de séries temporais, dossiês analíticos por país (formato ICD 203) e comparação entre indicadores

Principais recursos

  • Library: classifica todas as entidades por tipo, incluindo bandeiras
  • Country Profile: visualização de todos os campos de dados de cada país
  • Full-Text Search: busca por palavras-chave em mais de 1 milhão de campos com sintaxe Z39.58
  • Field Time Series: acompanhamento da evolução de um campo de dados específico ao longo de 36 anos
  • Factbook Quiz: quiz de conhecimentos mundiais com 4 modos
  • Factbook Export: geração de relatórios de país prontos para impressão com todos os campos

Ferramentas de análise de inteligência

  • Regional Dashboard: mapa-múndi com regiões COCOM e capitais marcadas
  • Timeline Map: visualização animada de 36 anos de dados
  • Communications Analysis: exibição de indicadores de penetração de internet, celular e banda larga
  • Map Compare: comparação sincronizada de mapas de dois anos
  • COCOM Region Detail: exibição de principais indicadores (KPI) por região
  • Intelligence Dossier: dossiê analítico por país com base no padrão ICD 203
  • Global Rankings: ordenação do ranking de países por indicador
  • Global Trends: tendências globais de indicadores ao longo de todas as edições
  • Compare Countries: comparação de indicadores entre países
  • Field Explorer: exploração de todos os campos de dados e estatísticas de cobertura
  • Change Detection: detecção de mudanças em campos por ano
  • Dissolved States: informações sobre países e territórios que já não existem
  • Trade Networks: grafo de rede de relações comerciais
  • Organization Networks: grafo de relações de filiação a organizações internacionais
  • Query Builder: criação de consultas analíticas personalizadas
  • Text Diff: comparação de textos por ano e destaque de alterações

Informações do projeto

  • Todos os dados foram coletados de material de domínio público do governo dos EUA (CIA World Factbook)
  • Sem relação com a CIA ou com o governo dos EUA
  • As análises seguem os padrões analíticos ICD 203
  • Código-fonte e metodologia estão disponíveis no repositório do GitHub

1 comentários

 
GN⁺ 2026-02-23
Comentários no Hacker News
  • Parece que o governo atual apagou todos os dados internos do CIA World Factbook, talvez para impedir qualquer tentativa futura de restauração
    Seria muito legal se o próximo governo reconstruísse isso usando esses dados arquivados
  • É exatamente assim que o Show HN deveria funcionar
    Alguém publica um projeto, a comunidade encontra bugs em tempo real, e o autor corrige na hora
    O problema de conflito entre códigos de país FIPS e ISO é um ótimo exemplo de como esses bugs raros só podem ser encontrados com muitos olhos
    Foi impressionante ver que o autor não ficou na defensiva e respondeu ativamente ao feedback
  • Há um repositório no GitHub para quem precisa dos arquivos JSON ou Markdown do Factbook
    Ele é descrito como um “cache do conjunto de dados de perfis de países no formato original (1:1) do CIA.gov”
    Os dados detalhados podem ser vistos em cache.factbook.json
    • Valeu pelo link! Meu GitHub e meu site também usam essa fonte
      Mas achei que era necessário transformar os dados de 1990 a 2025 em um banco de dados SQL para permitir consultas
  • Ao autor: se você estiver corrigindo campos do banco de dados ou bugs (como códigos de país), queria saber se poderia compartilhar essa versão também
    Esse conjunto de dados é excelente para testar funcionalidades de GraphRAG
    Também parece dar para criar um jogo de simulação mundial baseado em dados reais
    • Claro! Todas as alterações nos dados estão sendo gerenciadas em um changelog .txt
      O conteúdo original publicado pela CIA é mantido como está, e apenas o ruído de formatação é limpo durante o parsing
      Além disso, criei uma tabela de consulta para mapear os códigos FIPS 10-4, ISO Alpha-2/3 e o MasterCountryID, permitindo conectá-los entre si
      Também vou adicionar esses materiais ao GitHub
  • Projeto excelente. Mas encontrei um problema
    Ao clicar em “Germany” no Factbook de 2002, você é levado toda vez para a página de “Gambia”
    Não vi esse comportamento com outros países
    • Outro exemplo: ao pesquisar “Nicaragua”, ele leva para a página de “Niger”
  • A versão 2025–2026 já pode ser comprada e consultada externamente, e a edição 2026–2027 está prevista para ser lançada em 7 de abril
    Link da Amazon
    • Eu não sabia que esse tipo de livro era realmente publicado. Obrigado por avisar
    • O Internet Archive possui a edição 2025–2026, e ela será digitalizada e adicionada ao OpenLibrary
    • Quando for lançada, também vou adicioná-la ao meu projeto. Obrigado por compartilhar a informação
  • Este link é realmente impressionante: página de análise do histórico de mudanças
  • Projeto excelente. Mas parece que a população mundial foi contada em dobro
    Dá para ver isso na página de análise de tendências
    • Encontrei a causa. A entidade “World” (cerca de 8 bilhões de pessoas) estava sendo somada junto com os países individuais, então o total estava sendo calculado em dobro
      Obrigado pelo aviso!
    • Já estou corrigindo. Acho que, de tanto olhar para isso, acabei deixando passar. Obrigado por avisar
  • Este projeto é um arquivo que preserva um serviço encerrado pelo atual governo da Casa Branca?
    • Sim, é exatamente esse serviço
  • Há um bug no gráfico de séries temporais. É preciso fazer normalização (normalization) antes de visualizar os dados
    Exemplo: dados de assinaturas de banda larga fixa da Índia
    • Encontrei o problema. A regex que fazia o parsing dos totais não conseguia lidar com sufixos de unidade (million/billion etc.)
      Por exemplo, “18.17 million” estava sendo interpretado apenas como 18.17, causando uma queda brusca no gráfico
      Adicionei o tratamento de unidades, corrigi o bug e acabei de fazer o deploy
      Obrigado por reportar