- No texto, o autor fala sobre sua API favorita, ou seja, o zipfile no site do Banco Central Europeu, que fornece dados históricos sobre a posição do euro em relação a outras moedas.
- O autor mostra como baixar, descompactar e consultar os dados do zipfile usando várias ferramentas, como
curl, gunzip, sqlite3 e pandas.
- Os dados obtidos do zipfile estão em formato "wide", com uma coluna de data e colunas adicionais para cada moeda, o que não é ideal para filtragem e agregação.
- O autor usa
pandas para converter os dados do formato "wide" para o formato "long", ou seja, fazendo o processo de "melting".
- O autor também aponta um problema nos dados: há uma vírgula sobrando no fim de cada linha, o que atrapalha o processo de melting. Isso é resolvido adicionando
.iloc[:, :-1] à method chain do pandas.
- O autor reconhece que lidar com esses dados exige trabalho de "preparação de dados", mas observa que os dados cambiais do ECB são relativamente fáceis de manipular em comparação com outros lançamentos de dados abertos.
- Em seguida, o autor mostra como enviar os dados organizados para uma tabela do csvbase e como gerar gráficos dos dados usando
gnuplot.
- O autor também apresenta uma ferramenta chamada DuckDB, parecida com o SQLite, mas colunar, e mostra como usá-la para carregar um CSV diretamente via HTTP em um arquivo de tabela.
- O autor observa que dados abertos podem funcionar como uma API aberta e elogia a simplicidade do zipfile do ECB como formato de troca de dados.
- O autor também oferece uma breve história do euro e explica por que ele estava fraco em relação ao dólar quando foi lançado, em 2000.
Ainda não há comentários.