Cafe24 revela o LLM Router
(llm-router.cafe24.com)- Infraestrutura unificada de LLM para chamar mais de 100 modelos como Claude, Gemini, Qwen, Llama e DeepSeek por meio de um endpoint único
- Oferece uma API única compatível com OpenAI, eliminando a necessidade de aprender e manter separadamente especificações de API, lógica de retry e formatos de streaming diferentes para cada provider
- O Auto Router analisa o prompt para identificar se é um caso de código, raciocínio, tradução ou criação, e seleciona automaticamente o modelo com melhor custo-benefício
- Ex.: "Crie um código de scroll infinito em React" → detecta código → claude-sonnet-4-6
- Com Auto Fallback, em caso de falha ou timeout, muda imediatamente para uma rota alternativa pré-definida, e chamadas que falharem não são cobradas (ZCI)
- Ex.: qwen3-72b → llama-3.3-70b → deepseek-v3
- Com Provider Routing, é possível definir a prioridade dos providers de acordo com custo, velocidade e capacidade de processamento
- No modo BYOK (Bring Your Own Key), é possível registrar diretamente suas chaves de OpenAI/Anthropic/Google já existentes e controlar os custos de forma direta
- Com Semantic Cache, perguntas semelhantes pulam a própria chamada ao LLM para reduzir custos com tokens, e a resposta é retornada em milissegundos
- O recurso Preset permite salvar em conjunto o modelo primário, System Prompt, sampling e cadeias de fallback em múltiplas etapas; a chamada fica em uma linha, e os ajustes são feitos no console, com ZERO redistribuição de código
- Em Privacidade & governança, há suporte para mascaramento automático de informações sensíveis (PII) em logs e nos dados enviados ao modelo
- No Realtime Dashboard, é possível verificar solicitações, custos, tendência de tokens, participação de custo por modelo, taxas de sucesso/falha e logs detalhados por requisição
- No Playground, é possível comparar imediatamente, sem código, a qualidade de resposta, velocidade e custo entre modelos
- Cobrança por créditos conforme o uso, sem contrato nem assinatura, taxa básica mensal de 0 won, créditos grátis logo após o cadastro e suporte a cobrança em KRW com emissão de nota fiscal
Ainda não há comentários.