3 pontos por ragingwind 3 시간 전 | 4 comentários | Compartilhar no WhatsApp

A keynote da Qwen Conference, realizada pela primeira vez em Singapura, marcou o momento em que a Alibaba Cloud oficializou a transição para a “era da IA agêntica”. Representantes do governo de Singapura, executivos da Alibaba Cloud e parceiros como Nous Research, Fireworks AI, NVIDIA e PicsArt subiram ao palco para anunciar mudanças em modelos, infraestrutura, ferramentas e em todo o ecossistema. A mensagem central foi a construção de uma infraestrutura full stack capaz de transformar “tokens em inteligência, inteligência em ação e ação em valor de negócio”.

Principais anúncios

  • Parceria com o governo de Singapura: o ministro de Estado Desmond Tan anunciou uma colaboração com Alibaba Cloud, NTUC e ST Telemedia Global Data Centres para oferecer treinamento prático em IA generativa e agêntica a mais de 1.000 empresas locais, desenvolvedores e estudantes. Ele enfatizou o princípio de que “a IA não substitui os trabalhadores, ela trabalha para os trabalhadores”.

  • Lançamento do Qwen 3.7 Max: foi apresentado um novo modelo fundacional com grandes avanços em programação, uso de ferramentas (com suporte nativo ao protocolo MCP), multimodalidade e tarefas de longa duração (long-horizon). Segundo a empresa, ele alcançou desempenho de ponta em benchmarks importantes como SWE-Bench, IFBench e HLE.

  • Anúncio do Qwen Cloud: foi lançado o qwencloud.com, um gateway dedicado a agentes. A plataforma oferece mais de 200 modelos, planos cobrados por tokens (de US$ 30/mês no Standard ao Max) e automação de workflows baseada em Skills/CLI.

  • Coder e Muron: foram apresentados o Coder, uma ferramenta de vibe coding instalada no notebook, e o Muron, um agente multidomínio que opera 24 horas por dia na nuvem. O Muron já está em uso em 43 países, e a Alibaba também revelou que construiu internamente o Coder Works com uma equipe de 5 pessoas em 7 dias.

  • Infraestrutura de nuvem agêntica: foi revelado um stack full stack com sandbox baseada em MicroVM (boot em milissegundos, suporte a 10 mil sessões simultâneas por tenant), além de agent ID, governança, segurança, memória e data plane. A MiniMax afirmou ter alcançado boot de contêineres em 20~40 ms e redução de 40% no TCO sobre essa base.

Diferenciais técnicos

  • Integração full stack: a empresa destacou ser uma das duas únicas hyperscalers que controlam todas as camadas, do silício (PPU própria, CIPU de 5ª geração) até os modelos fundacionais.
  • Nuvem agent-native: em vez de uma arquitetura centrada em SaaS para uso humano, a Alibaba está redesenhando todo o control plane em torno de APIs e infraestrutura chamadas e usadas diretamente por agentes.
  • Ecossistema aberto: a empresa entrou como membro Platinum da PyTorch Foundation e está posicionando o Model Studio como um hub multimodelo, incluindo até modelos de empresas concorrentes como Kimi, Zhipu, MiniMax, StepFun e Vidu.

Pontos destacados como vantagens

  • Eficiência de custo: a empresa afirmou que os planos por token dão visibilidade de custos e controle orçamentário, e que a seleção automática de modelos no Coder pode reduzir o gasto com tokens em até 70%.
  • Capacidade de execução de longa duração: segundo a apresentação, o Qwen 3.7 Max demonstrou casos de uso com 35 horas contínuas de execução, mais de 1.000 chamadas de ferramentas e ganho médio de velocidade de 10x.
  • Confiança e segurança: a Alibaba Cloud destacou que foi a única fornecedora da Ásia-Pacífico listada no Gartner 2025 Magic Quadrant for Access Management e enfatizou mecanismos de segurança em runtime como agent firewall e ID guard.

Limitações e desafios apontados

  • Dificuldade para construir confiança: Tommy Eastman, da Nous Research, observou que ainda é um grande desafio fazer com que a mesma tarefa seja executada de forma reproduzível, e defendeu uma abordagem em três etapas: qualidade do modelo, human-in-the-loop e governança entre agentes.
  • Gargalo de memória: a Fireworks AI afirmou que o maior gargalo da inferência não é computação, mas a memória do cache KV, e avaliou que são necessários storage multicamadas e um redesenho sistêmico.
  • Redescoberta da CPU: a NVIDIA apontou que, devido à natureza serial das chamadas de ferramentas por agentes, deve explodir a demanda por novas CPUs com alto desempenho single-thread, o que coloca em xeque premissas tradicionais de design de CPUs para nuvem.

Casos do ecossistema

  • PicsArt: com base em 130 milhões de usuários, a empresa integrou Qwen Image, Wan e Happy Horse para demonstrar workflows agênticos como casting de personas e produção de anúncios em vídeo. Segundo a empresa, após a adoção do Happy Horse, o volume de geração de vídeos cresceu 72%.
  • Hackathon global: a Alibaba anunciou ao mesmo tempo o Qwen Cloud Global Hackathon, com premiação total de US$ 70 mil, e o Happy Horse Awards 2026, buscando atrair desenvolvedores e criadores.

Comparação com as conferências do Google

O Google Cloud Next 2025 (abril) e o I/O 2025 (maio), realizados um mês antes, apontaram basicamente para a mesma direção, mas com armas diferentes.

  • Linha de anúncios do Google: Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), protocolo Agent2Agent (A2A), TPU Ironwood de 7ª geração, óculos Android XR e Veo 3, cobrindo busca, dispositivos e infraestrutura.
  • Métricas de usuários do Google: a AI Mode chegou a 150 milhões de usuários em 200 países, o app Gemini atingiu 400 milhões de usuários mensais, e o volume de processamento de tokens cresceu 50x em um ano, de 9,7 trilhões para 480 trilhões.
  • Diferença de estratégia: enquanto a Alibaba aposta ao mesmo tempo em integração vertical full stack e numa estratégia de hub baseada em open source (mais de 450 modelos, 2 bilhões de downloads acumulados) e inclusão de modelos concorrentes, o Google respondeu com enorme escala de distribuição, TPUs próprias e liderança no padrão A2A.
  • Fraquezas de cada lado: o Google mantém o principal Gemini como fechado e boa parte dos anúncios ainda está em estado de “coming soon”, enquanto a Alibaba encara limitações de acesso aos mercados dos EUA e da Europa, além dos desafios de confiabilidade e gargalos de memória mencionados no painel.
  • Áreas de vantagem no curto prazo: no curto prazo, o Google leva vantagem em escala de usuários e form factors, enquanto a Alibaba se destaca em custo de infraestrutura e fora dos EUA

A Alibaba Cloud avalia que só a competitividade de seus próprios modelos não basta para conquistar a liderança na era dos agentes. Por isso, está avançando ao mesmo tempo em integração vertical, do silício aos modelos, infraestrutura, ferramentas e ecossistema, e em expansão horizontal, aproximando-se da PyTorch e até de empresas de modelos concorrentes. Ainda assim, como desafios fundamentais como confiabilidade, gargalos de memória e redesenho de arquitetura de CPU foram repetidamente mencionados no painel, continua em aberto provar que a nuvem agêntica conseguirá entregar, em workloads corporativos reais, o desempenho e a eficiência econômica prometidos. Ao posicionar Singapura como base de seus negócios internacionais, a empresa também deixou clara ao longo do evento a intenção de intensificar a disputa com as hyperscalers americanas.

4 comentários

 
yupkidangju 1 시간 전

Mesmo quando é escrito automaticamente por IA, a lição deste artigo é que a verificação humana ainda é necessária.

 
jhk0530 3 시간 전

Não é qwen, e sim Qwen? Parece que a IA não fez uma boa transcrição.

 
dydwls140 2 시간 전

Boa percepção, eu tinha lido como qwen também kkkkkkk

 
tsboard 2 시간 전

Pois é, eu também estava lendo e pensando: o que é Quen??