Uma ferramenta de CLI que permite usar arquivos CSV como se fossem um banco de dados. Open source em Rust
Mesclar arquivos, contar linhas, criar largura fixa, reformatar (alterar delimitadores etc.),
join (inner, outer, cross), particionamento por valor de coluna, amostragem, ordem inversa, extração de colunas específicas, reordenação de colunas,
sort, divisão (em N arquivos), stats (média, variância, mediana, intervalo etc. de cada coluna), visualização em formato de tabela
2 comentários
Spark local?!
Parece ser útil para limpar dados CSV durante a análise de dados.
Exemplo de como fazer join no estilo SQL - https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/