- Um framework com o objetivo de unificar o processamento de stream processing / batch processing / workloads de computação de alto desempenho (IA)
- Atualmente oferece uma solução drop-in replacement para Spark SQL e Spark DataFrame API (compatível)
- Pode operar em uma única máquina ou em configuração distribuída
- No benchmark TPC-H, é 4 vezes mais rápido que o Spark, reduz 94% dos custos de hardware e não exige mudanças no código
- Disponível como pacote Python:
pip install "pysail==0.2.0.dev0"
- Stack técnica
- Engine baseada em Rust, construída sobre Apache Arrow e Apache DataFusion
- Usa o protocolo Spark Connect para que a sessão Spark se comunique com o servidor Sail
Ainda não há comentários.