Vertex AI Priority PayGo: validado em 27.000 casos em produção e não houve diferença em relação ao Standard

calmlake79 · 2026-02-25T11:06:54+09:00

Compartilhamento dos resultados da aplicação do Priority PayGo do Vertex AI a um chatbot de IA em produção real e da análise, por faixa horária, de cerca de 27.000 registros acumulados ao longo de aproximadamente 2 semanas Com base na mediana (Median), o tempo de resposta de ON_DEMAND(Standard) e ON_DEMAND_PRIORITY ficou, na maioria dos casos, dentro de 100~300ms, com desempenho praticamente idêntico O único horário em que o Priority foi significativamente mais rápido foi às 16h (-338ms); nas outras 23 horas, foi semelhante ou até mais lento que o Standard A proporção de requisições acima de 10 segundos foi de 3,4% no Standard e 5,9% no Priority, indicando que o Priority foi, na prática, 1,7 vez mais instável Em especial no período noturno (22h~23h), a taxa de requisições acima de 10 segundos no Priority ultrapassou 12%, mais de 3 vezes maior que no Standard Considerando que o custo por token é 1,8 vez maior, conclui-se que, no momento, o Priority PayGo não oferece vantagem de custo-benefício em desempenho Como os resultados são do ambiente gemini-3-flash-preview (modelo preview) + asia-northeast3 (região de Seul), eles podem mudar após o lançamento da versão GA

(cloudturing.com)

1 pontos por calmlake79 2026-02-25 | Ainda não há comentários. | Compartilhar no WhatsApp

Compartilhamento dos resultados da aplicação do Priority PayGo do Vertex AI a um chatbot de IA em produção real e da análise, por faixa horária, de cerca de 27.000 registros acumulados ao longo de aproximadamente 2 semanas
Com base na mediana (Median), o tempo de resposta de ON_DEMAND(Standard) e ON_DEMAND_PRIORITY ficou, na maioria dos casos, dentro de 100~300ms, com desempenho praticamente idêntico
O único horário em que o Priority foi significativamente mais rápido foi às 16h (-338ms); nas outras 23 horas, foi semelhante ou até mais lento que o Standard
A proporção de requisições acima de 10 segundos foi de 3,4% no Standard e 5,9% no Priority, indicando que o Priority foi, na prática, 1,7 vez mais instável
Em especial no período noturno (22h~23h), a taxa de requisições acima de 10 segundos no Priority ultrapassou 12%, mais de 3 vezes maior que no Standard
Considerando que o custo por token é 1,8 vez maior, conclui-se que, no momento, o Priority PayGo não oferece vantagem de custo-benefício em desempenho
Como os resultados são do ambiente gemini-3-flash-preview (modelo preview) + asia-northeast3 (região de Seul), eles podem mudar após o lançamento da versão GA

Vertex AI Priority PayGo: validado em 27.000 casos em produção e não houve diferença em relação ao Standard

Leituras relacionadas

Ainda não há comentários.