- Ollama Turbo é uma nova solução para executar modelos de IA open source em grande escala rapidamente em hardware de data center de alto desempenho (US$ 20/mês)
- Permite operar modelos grandes de forma rápida e eficiente sem alterar os apps, CLI, API e bibliotecas JavaScript/Python do Ollama
- Atualmente em prévia, oferece suporte aos modelos abertos da OpenAI gpt-oss-20b e gpt-oss-120b
- Ao usar o modo Turbo, os dados das consultas não são armazenados no servidor nem registrados em logs
- O hardware é operado apenas em data centers nos EUA, com limites de uso por hora e por dia, e um sistema de cobrança por uso também está previsto
Ainda não há comentários.