- O Apple Intelligence foi reformulado com uma nova arquitetura baseada nos Apple Foundation Models, desenvolvidos em conjunto com o Google
- Os novos modelos são baseados em tecnologias da família Gemini e foram ajustados tanto para execução no dispositivo quanto em servidores do Private Cloud Compute
- Os modelos atualizados oferecem suporte a compreensão e geração de imagens, geração de imagens realistas, edição avançada de fotos e perguntas e respostas visuais
- Alguns dispositivos receberão um modelo de alto desempenho com geração de voz, melhor precisão de ditado e compreensão de linguagem natural mais avançada, mas os aparelhos contemplados não foram especificados
- A Apple afirma que os dados do usuário são usados apenas para executar solicitações imediatas, que nem a Apple nem terceiros podem acessá-los e que especialistas externos podem verificar as garantias de privacidade a qualquer momento
Reformulação da arquitetura do Apple Intelligence
- A Apple anunciou uma grande reformulação da plataforma Apple Intelligence e revelou uma nova arquitetura baseada em modelos fundamentais desenvolvidos em conjunto com o Google usando tecnologias da família Gemini
- No centro da nova arquitetura estão os Apple Foundation Models, desenvolvidos em parceria com o Google, e a Apple afirma que esses modelos foram ajustados tanto para processamento no dispositivo quanto para execução em servidores do Private Cloud Compute
- A Apple descreveu a colaboração com o Google como “profunda” e afirmou que ela traz um “enorme upgrade” para o Apple Intelligence
- Os novos modelos oferecem recursos mais recentes de compreensão e raciocínio, além de suporte multimodal, incluindo compreensão e geração de imagens
Recursos dos novos modelos
- Os modelos atualizados oferecem suporte a novos casos de uso, incluindo geração de imagens realistas, edição avançada de fotos e perguntas e respostas visuais
- Alguns dispositivos receberão uma versão de alto desempenho do modelo com recursos adicionais
- A versão de alto desempenho do modelo oferece geração de voz, melhor precisão de ditado e compreensão de linguagem natural mais robusta
- A Apple não especificou quais dispositivos receberão o modelo de alto desempenho
Orquestrador de sistema
- No centro da arquitetura reformulada está um novo orquestrador de sistema
- O orquestrador de sistema coordena com segurança os recursos do Apple Intelligence em toda a plataforma da Apple
- A Apple afirma que o orquestrador pode personalizar respostas com base no app ativo e na tarefa atual do usuário
- Essa estrutura torna possível o que a Apple chamou de “verdadeira inteligência em todo o sistema”
Abordagem de privacidade
- A Apple contrapôs sua abordagem à de concorrentes, dizendo que eles estão “correndo na frente” sem considerar os usuários
- O Apple Intelligence depende de processamento no dispositivo e do Private Cloud Compute
- Mantém-se a promessa de que os dados do usuário são usados apenas para executar solicitações imediatas e não podem ser acessados pela Apple nem por terceiros
- A Apple acrescentou que especialistas externos podem verificar essas garantias de privacidade “a qualquer momento”
1 comentários
Opiniões no Hacker News
A forma como a Apple está correndo atrás da IA parece bem a cara da Apple: envolver ferramentas externas em uma arquitetura de privacidade, colocá-las no sistema operacional e transformar a camada de orquestração em produto
É interessante pensar se o Private Cloud Compute e o roteamento on-device conseguem fazer os recursos de modelos de terceiros parecerem um sistema de primeira parte, sem vazar o contexto do usuário
Se a Apple lidar bem com a fronteira Google-Apple, isso pode ser um movimento elegante; caso contrário, pode parecer só um frontend do Apple Intelligence com uma camada bonita de privacidade por cima do Gemini
Os chatbots de terceiros de hoje não conseguem esse tipo de integração e, mesmo que conseguissem, seria difícil confiar esse nível de permissão a outra empresa
Garantias fortes de privacidade seriam melhores, mas ainda assim parece uma direção razoável
Devem ter considerado vários fatores, incluindo modelos menores, mas custo provavelmente também foi uma grande preocupação, e o Google parece ser o único provedor distribuindo tanta inferência de IA gratuita assim
Essa mudança vai deixar ainda mais nebuloso quando e como consumidores ou funcionários devem pagar pelos custos de serviços de IA. Por exemplo, na apresentação mostraram tarefas de consumo, não de programação, mas será que eu poderia selecionar 5 arquivos e pedir para a Siri escrever um script em Python ou um pequeno app? Empresas vão simplesmente desativar os recursos de IA da Siri, ou poderão roteá-los para seu próprio sistema de auditoria e seus próprios provedores de IA?
Quero entender melhor o que de fato move o Apple Intelligence. É um modelo flagship do Gemini por trás de prompts próprios, é fine-tuning, ou a Apple pré-treinou seu próprio modelo com base no Gemini?
Também quero saber se existe uma diferença significativa entre os modelos baseados em Gemini e os Apple Foundation Models. Não está claro se essa diferença muda entre modelos on-device e hospedados, se alguns rodam no Private Cloud Compute da Apple e outros em hardware do Google
Depois explicaram isso com bastante detalhe no “keynote tech-talk”: [0]
Segundo a Apple, são 5 modelos. No on-device há o AFM Core, um modelo on-device padrão de próxima geração com arquitetura densa, e o AFM Core Advanced, de arquitetura esparsa e multimodal nativa, que possibilita compreensão de imagem e voz mais expressiva
No Private Cloud Compute há o AFM Cloud, o modelo principal de servidor otimizado para latência e custo, o AFM Cloud Image para geração e edição de imagens, e o AFM Cloud Pro, o modelo topo de linha para raciocínio complexo e tarefas de agente. O Cloud Pro tem qualidade no nível dos modelos de ponta do Gemini e roda em GPUs NVIDIA na nuvem do Google sob as garantias de privacidade do PCC da Apple
Tudo exceto o Cloud Pro são modelos personalizados executados em Apple Silicon e, segundo a Apple, “refinados” com o Google Gemini. Sobre o Cloud Pro, a descrição é “o modelo mais poderoso, com qualidade semelhante à dos Gemini frontier models”, então, lendo nas entrelinhas, parece ser Gemini envolto numa camada da Apple
[0]: https://9to5mac.com/2026/06/…
https://machinelearning.apple.com/research/introducing-apple...
Se você tiver um Mac, pode testar isso por conta própria
https://apfel.franzai.com/
Uma versão mais poderosa, que só funcionaria em dispositivos com 12 GB de RAM, provavelmente seria um modelo semelhante, mas um pouco maior, ainda não divulgado
O Google já anunciou antes que permitiria alugar hardware em seus próprios data centers para rodar o Gemini completo. É uma abordagem baseada em NVIDIA que permite que empresas treinem ou acessem os modelos sem enviar dados para os data centers do Google. O Private Compute também pode ser algo em que a Apple alugue esse tipo de equipamento em grande escala
Essa promessa do tipo “a Apple precisa ver os dados para realizar esse recurso, mas não tem como ver esses dados mesmo que queira” parece impossível
Seria preciso liberar o iOS como open source, permitir que o usuário controle o dispositivo e hospede a inferência por conta própria, para poder verificar que não há tráfego de rede. Se for exatamente como dizem, então não deveria haver desvantagem em deixar o próprio usuário hospedar
Em essência, ainda parece estar fazendo o que o Google Assistant e a Siri já vinham fazendo há vários anos
Não está muito claro o que se ganha a mais aqui
Da mesma forma, o código manual com milhões de linhas do Google Translate foi totalmente substituído por grandes modelos de linguagem que traduzem muito melhor
Assistentes de IA baseados em grandes modelos de linguagem usam uma pilha tecnológica completamente diferente da programação lógica no estilo “if-then-else” em que a Siri antiga se baseava, e suas capacidades também são muito diferentes
É estranho que a Apple esteja se colocando em desvantagem ao escolher o Google como fornecedor em vez de Anthropic ou OpenAI
Isso não torna mais difícil diferenciar do assistente dos celulares Android? Num tom mais cínico, se quisesse, o Google poderia fornecer à Apple uma versão inferior do Gemini para manter sua própria vantagem, não?
Do ponto de vista do consumidor, independentemente da plataforma de celular escolhida, a base acaba sendo a mesma, e isso é ruim porque não há como evitar isso a não ser simplesmente não usar assistente nenhum
O Google já trabalhou mais do que a Anthropic ou a OpenAI em rodar grandes modelos de linguagem em dispositivos de borda
A fonte também diz que a nova arquitetura é centrada nos Apple Foundation Models, desenvolvidos em conjunto com o Google, e ajustados para operar tanto on-device quanto em servidores por meio da infraestrutura Private Cloud Compute da Apple
Isso pode significar que Google e Apple treinaram modelos sob medida para o hardware da Apple, provavelmente modelos on-device
Se o Gemini virar um detalhe de implementação, fica aberta a possibilidade de trocar depois por Anthropic ou OpenAI sem que o usuário final saiba ou se importe. Então acho que eles estão criando alavancagem para negociações futuras
E a Apple provavelmente queimou algumas pontes por causa do acordo que tinha firmado com a OpenAI um ano antes
Fui assinante pago do Claude por alguns anos, mas hoje em dia uso mais o app gratuito do Gemini no Android Pixel 9. Ele faz buscas muito bem como parte da resposta, o que é ótimo
O modelo parece novo e atualizado. Ainda é uma questão em aberto se a Apple conseguirá integrar também essa função de busca
Posso estar errado, mas isso parece um golpe bem grande nas alegações de privacidade da Apple
A Apple acrescentou que especialistas externos podem verificar essas garantias de privacidade “a qualquer momento”
Você acha que o Google não protege a privacidade de grandes clientes pagantes?
Usei produtos pagos do Google sem problemas por anos, e as garantias de privacidade sempre foram claras
Muita gente está deixando passar que o Google está muito mais à frente em IA de borda
Já venho dizendo isso desde antes da febre do GPT, e os celulares Pixel já tinham legendas em tempo real, ou seja, transcrição de fala no próprio aparelho, há um bom tempo
Esse movimento faz lembrar o iPhone original com o Google Maps embutido
É uma estrutura em que compete com o Google, mas ainda usa a infraestrutura deles. Por que não escolheram outro fornecedor, como OpenAI ou Anthropic?
Talvez a OpenAI não tenha permitido que seus modelos rodassem nos servidores da Apple
O Google era bom no trabalho web de backend, e a Apple pegava os dados em nuvem do Google e criava aplicativos locais excelentes. O app do YouTube era a mesma coisa
Depois que o Google viu o iPhone antes do lançamento, mudou a direção do Android, e o Android, que originalmente era um hardware no estilo BlackBerry, virou para o rumo atual, começando a “guerra termonuclear”. Também é interessante que Steve Jobs tenha mostrado o iPhone desse jeito. Segundo Jobs, algo parecido tinha acontecido com Bill Gates, e isso acabou levando ao desenvolvimento do Windows
Agora, 19 anos depois, pode ser hora de voltar a uma abordagem pragmática. Se a Apple não conseguir oferecer direito esse tipo de integração de IA no sistema operacional, corre o risco de perder usuários para o Android. Se de qualquer forma vai precisar pagar pelo modelo, faz sentido escolher o que achar melhor para o usuário. Isso parece vantajoso para a Apple, porque ajuda a manter os atuais usuários de iPhone e também pode atrair usuários de Android que querem os mesmos recursos, mas com melhor privacidade
Neste ponto, pagar a OpenAI em vez do Google seria quase por rancor. Pode até haver motivos para isso, mas como toda a liderança mudou nos últimos 20 anos, seria como continuar uma guerra antiga. Ainda assim, antes de mostrar ao Google algo que ainda não foi anunciado, eu pensaria duas vezes
A Apple já mantém todo mundo no próprio bolso por meio do ecossistema, então basta não estragar isso. Aqui a prioridade é mais estabilidade do que competição
Cada divisão do Google opera quase como uma empresa da Fortune 500 por conta própria, e tende a agir de acordo com os próprios interesses
O Google provavelmente ofereceu as melhores condições. Um player em terceiro lugar acaba sacrificando margem para ganhar volume
Seria bom se a UE obrigasse a Apple a permitir que o usuário final escolhesse modelos externos
Seria ótimo se um modelo local com foco em privacidade pudesse chamar qualquer modelo desejado, como Claude, Grok ou DeepSeek, por meio de um protocolo aberto bem definido
Isso soa como uma arquitetura de sistema operacional de verdade. Dá para deixar de lado esse modelo de negócio baseado em rebates
Obrigar a Apple a oferecer suporte a todo tipo de modelo arbitrário? É uma ideia absurdamente ruim