13 pontos por xguru 2020-12-23 | Ainda não há comentários. | Compartilhar no WhatsApp

"Run inference at scale"

  • Suporta vários modelos, incluindo TensorFlow, PyTorch e Sklearn

  • Deploy em grande escala em AWS/GCP/Azure etc. e autoescalonamento baseado em requests

  • Integração com sistemas de CI/CD

  • Streaming de métricas de desempenho e logs para ferramentas de monitoramento

  • Servir vários modelos com eficiência por meio de cache multimodelo

  • Suporte a rolling updates sem downtime

  • Divisão de tráfego para testes A/B

Ainda não há comentários.

Ainda não há comentários.