A keynote da Qwen Conference, realizada pela primeira vez em Singapura, marcou o momento em que a Alibaba Cloud oficializou a transição para a “era da IA agêntica”. Representantes do governo de Singapura, executivos da Alibaba Cloud e parceiros como Nous Research, Fireworks AI, NVIDIA e PicsArt subiram ao palco para anunciar mudanças em modelos, infraestrutura, ferramentas e em todo o ecossistema. A mensagem central foi a construção de uma infraestrutura full stack capaz de transformar “tokens em inteligência, inteligência em ação e ação em valor de negócio”.
Principais anúncios
-
Parceria com o governo de Singapura: o ministro de Estado Desmond Tan anunciou uma colaboração com Alibaba Cloud, NTUC e ST Telemedia Global Data Centres para oferecer treinamento prático em IA generativa e agêntica a mais de 1.000 empresas locais, desenvolvedores e estudantes. Ele enfatizou o princípio de que “a IA não substitui os trabalhadores, ela trabalha para os trabalhadores”.
-
Lançamento do Qwen 3.7 Max: foi apresentado um novo modelo fundacional com grandes avanços em programação, uso de ferramentas (com suporte nativo ao protocolo MCP), multimodalidade e tarefas de longa duração (long-horizon). Segundo a empresa, ele alcançou desempenho de ponta em benchmarks importantes como SWE-Bench, IFBench e HLE.
-
Anúncio do Qwen Cloud: foi lançado o qwencloud.com, um gateway dedicado a agentes. A plataforma oferece mais de 200 modelos, planos cobrados por tokens (de US$ 30/mês no Standard ao Max) e automação de workflows baseada em Skills/CLI.
-
Coder e Muron: foram apresentados o Coder, uma ferramenta de vibe coding instalada no notebook, e o Muron, um agente multidomínio que opera 24 horas por dia na nuvem. O Muron já está em uso em 43 países, e a Alibaba também revelou que construiu internamente o Coder Works com uma equipe de 5 pessoas em 7 dias.
-
Infraestrutura de nuvem agêntica: foi revelado um stack full stack com sandbox baseada em MicroVM (boot em milissegundos, suporte a 10 mil sessões simultâneas por tenant), além de agent ID, governança, segurança, memória e data plane. A MiniMax afirmou ter alcançado boot de contêineres em 20~40 ms e redução de 40% no TCO sobre essa base.
Diferenciais técnicos
- Integração full stack: a empresa destacou ser uma das duas únicas hyperscalers que controlam todas as camadas, do silício (PPU própria, CIPU de 5ª geração) até os modelos fundacionais.
- Nuvem agent-native: em vez de uma arquitetura centrada em SaaS para uso humano, a Alibaba está redesenhando todo o control plane em torno de APIs e infraestrutura chamadas e usadas diretamente por agentes.
- Ecossistema aberto: a empresa entrou como membro Platinum da PyTorch Foundation e está posicionando o Model Studio como um hub multimodelo, incluindo até modelos de empresas concorrentes como Kimi, Zhipu, MiniMax, StepFun e Vidu.
Pontos destacados como vantagens
- Eficiência de custo: a empresa afirmou que os planos por token dão visibilidade de custos e controle orçamentário, e que a seleção automática de modelos no Coder pode reduzir o gasto com tokens em até 70%.
- Capacidade de execução de longa duração: segundo a apresentação, o Qwen 3.7 Max demonstrou casos de uso com 35 horas contínuas de execução, mais de 1.000 chamadas de ferramentas e ganho médio de velocidade de 10x.
- Confiança e segurança: a Alibaba Cloud destacou que foi a única fornecedora da Ásia-Pacífico listada no Gartner 2025 Magic Quadrant for Access Management e enfatizou mecanismos de segurança em runtime como agent firewall e ID guard.
Limitações e desafios apontados
- Dificuldade para construir confiança: Tommy Eastman, da Nous Research, observou que ainda é um grande desafio fazer com que a mesma tarefa seja executada de forma reproduzível, e defendeu uma abordagem em três etapas: qualidade do modelo, human-in-the-loop e governança entre agentes.
- Gargalo de memória: a Fireworks AI afirmou que o maior gargalo da inferência não é computação, mas a memória do cache KV, e avaliou que são necessários storage multicamadas e um redesenho sistêmico.
- Redescoberta da CPU: a NVIDIA apontou que, devido à natureza serial das chamadas de ferramentas por agentes, deve explodir a demanda por novas CPUs com alto desempenho single-thread, o que coloca em xeque premissas tradicionais de design de CPUs para nuvem.
Casos do ecossistema
- PicsArt: com base em 130 milhões de usuários, a empresa integrou Qwen Image, Wan e Happy Horse para demonstrar workflows agênticos como casting de personas e produção de anúncios em vídeo. Segundo a empresa, após a adoção do Happy Horse, o volume de geração de vídeos cresceu 72%.
- Hackathon global: a Alibaba anunciou ao mesmo tempo o Qwen Cloud Global Hackathon, com premiação total de US$ 70 mil, e o Happy Horse Awards 2026, buscando atrair desenvolvedores e criadores.
Comparação com as conferências do Google
O Google Cloud Next 2025 (abril) e o I/O 2025 (maio), realizados um mês antes, apontaram basicamente para a mesma direção, mas com armas diferentes.
- Linha de anúncios do Google: Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), protocolo Agent2Agent (A2A), TPU Ironwood de 7ª geração, óculos Android XR e Veo 3, cobrindo busca, dispositivos e infraestrutura.
- Métricas de usuários do Google: a AI Mode chegou a 150 milhões de usuários em 200 países, o app Gemini atingiu 400 milhões de usuários mensais, e o volume de processamento de tokens cresceu 50x em um ano, de 9,7 trilhões para 480 trilhões.
- Diferença de estratégia: enquanto a Alibaba aposta ao mesmo tempo em integração vertical full stack e numa estratégia de hub baseada em open source (mais de 450 modelos, 2 bilhões de downloads acumulados) e inclusão de modelos concorrentes, o Google respondeu com enorme escala de distribuição, TPUs próprias e liderança no padrão A2A.
- Fraquezas de cada lado: o Google mantém o principal Gemini como fechado e boa parte dos anúncios ainda está em estado de “coming soon”, enquanto a Alibaba encara limitações de acesso aos mercados dos EUA e da Europa, além dos desafios de confiabilidade e gargalos de memória mencionados no painel.
- Áreas de vantagem no curto prazo: no curto prazo, o Google leva vantagem em escala de usuários e form factors, enquanto a Alibaba se destaca em custo de infraestrutura e fora dos EUA
A Alibaba Cloud avalia que só a competitividade de seus próprios modelos não basta para conquistar a liderança na era dos agentes. Por isso, está avançando ao mesmo tempo em integração vertical, do silício aos modelos, infraestrutura, ferramentas e ecossistema, e em expansão horizontal, aproximando-se da PyTorch e até de empresas de modelos concorrentes. Ainda assim, como desafios fundamentais como confiabilidade, gargalos de memória e redesenho de arquitetura de CPU foram repetidamente mencionados no painel, continua em aberto provar que a nuvem agêntica conseguirá entregar, em workloads corporativos reais, o desempenho e a eficiência econômica prometidos. Ao posicionar Singapura como base de seus negócios internacionais, a empresa também deixou clara ao longo do evento a intenção de intensificar a disputa com as hyperscalers americanas.
4 comentários
Mesmo quando é escrito automaticamente por IA, a lição deste artigo é que a verificação humana ainda é necessária.
Não é
qwen, e simQwen? Parece que a IA não fez uma boa transcrição.Boa percepção, eu tinha lido como qwen também kkkkkkk
Pois é, eu também estava lendo e pensando: o que é Quen??