- Compartilhamento dos resultados da aplicação do Priority PayGo do Vertex AI a um chatbot de IA em produção real e da análise, por faixa horária, de cerca de 27.000 registros acumulados ao longo de aproximadamente 2 semanas
- Com base na mediana (Median), o tempo de resposta de ON_DEMAND(Standard) e ON_DEMAND_PRIORITY ficou, na maioria dos casos, dentro de 100~300ms, com desempenho praticamente idêntico
- O único horário em que o Priority foi significativamente mais rápido foi às 16h (-338ms); nas outras 23 horas, foi semelhante ou até mais lento que o Standard
- A proporção de requisições acima de 10 segundos foi de 3,4% no Standard e 5,9% no Priority, indicando que o Priority foi, na prática, 1,7 vez mais instável
- Em especial no período noturno (22h~23h), a taxa de requisições acima de 10 segundos no Priority ultrapassou 12%, mais de 3 vezes maior que no Standard
- Considerando que o custo por token é 1,8 vez maior, conclui-se que, no momento, o Priority PayGo não oferece vantagem de custo-benefício em desempenho
- Como os resultados são do ambiente gemini-3-flash-preview (modelo preview) + asia-northeast3 (região de Seul), eles podem mudar após o lançamento da versão GA
Ainda não há comentários.