11 pontos por xguru 2024-12-01 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Um framework com o objetivo de unificar o processamento de stream processing / batch processing / workloads de computação de alto desempenho (IA)
  • Atualmente oferece uma solução drop-in replacement para Spark SQL e Spark DataFrame API (compatível)
  • Pode operar em uma única máquina ou em configuração distribuída
  • No benchmark TPC-H, é 4 vezes mais rápido que o Spark, reduz 94% dos custos de hardware e não exige mudanças no código
  • Disponível como pacote Python: pip install "pysail==0.2.0.dev0"
  • Stack técnica
    • Engine baseada em Rust, construída sobre Apache Arrow e Apache DataFusion
    • Usa o protocolo Spark Connect para que a sessão Spark se comunique com o servidor Sail

Ainda não há comentários.

Ainda não há comentários.