4 pontos por xguru 2020-01-02 | 2 comentários | Compartilhar no WhatsApp

Uma ferramenta de CLI que permite usar arquivos CSV como se fossem um banco de dados. Open source em Rust

Mesclar arquivos, contar linhas, criar largura fixa, reformatar (alterar delimitadores etc.),

join (inner, outer, cross), particionamento por valor de coluna, amostragem, ordem inversa, extração de colunas específicas, reordenação de colunas,

sort, divisão (em N arquivos), stats (média, variância, mediana, intervalo etc. de cada coluna), visualização em formato de tabela

2 comentários

 
iolothebard 2020-01-02

Spark local?!

 
xguru 2020-01-02

Parece ser útil para limpar dados CSV durante a análise de dados.

Exemplo de como fazer join no estilo SQL - https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/