11 pontos por xguru 2021-07-09 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Oferece uma API Python semelhante à do Apache Spark / Dask, mas

→ não chama o interpretador Python

→ gera bytecode LLVM otimizado para o pipeline fornecido e o conjunto de dados de entrada

→ 5 a 91x mais rápido que o interpretador

  • Internamente, baseia-se em compilação orientada por dados e processamento em modo duplo, alcançando velocidade semelhante à de pipelines otimizados escritos em C++

  • Suporta MacOS / Linux

  • Artigo apresentado na SIGMOD '21: "Tuplex: Data Science in Python at Native Code Speed"

Ainda não há comentários.

Ainda não há comentários.