1 pontos por GN⁺ 2 시간 전 | 1 comentários | Compartilhar no WhatsApp
Publicidade
  • O Apple Intelligence foi reformulado com uma nova arquitetura baseada nos Apple Foundation Models, desenvolvidos em conjunto com o Google
  • Os novos modelos são baseados em tecnologias da família Gemini e foram ajustados tanto para execução no dispositivo quanto em servidores do Private Cloud Compute
  • Os modelos atualizados oferecem suporte a compreensão e geração de imagens, geração de imagens realistas, edição avançada de fotos e perguntas e respostas visuais
  • Alguns dispositivos receberão um modelo de alto desempenho com geração de voz, melhor precisão de ditado e compreensão de linguagem natural mais avançada, mas os aparelhos contemplados não foram especificados
  • A Apple afirma que os dados do usuário são usados apenas para executar solicitações imediatas, que nem a Apple nem terceiros podem acessá-los e que especialistas externos podem verificar as garantias de privacidade a qualquer momento

Reformulação da arquitetura do Apple Intelligence

  • A Apple anunciou uma grande reformulação da plataforma Apple Intelligence e revelou uma nova arquitetura baseada em modelos fundamentais desenvolvidos em conjunto com o Google usando tecnologias da família Gemini
  • No centro da nova arquitetura estão os Apple Foundation Models, desenvolvidos em parceria com o Google, e a Apple afirma que esses modelos foram ajustados tanto para processamento no dispositivo quanto para execução em servidores do Private Cloud Compute
  • A Apple descreveu a colaboração com o Google como “profunda” e afirmou que ela traz um “enorme upgrade” para o Apple Intelligence
  • Os novos modelos oferecem recursos mais recentes de compreensão e raciocínio, além de suporte multimodal, incluindo compreensão e geração de imagens

Recursos dos novos modelos

  • Os modelos atualizados oferecem suporte a novos casos de uso, incluindo geração de imagens realistas, edição avançada de fotos e perguntas e respostas visuais
  • Alguns dispositivos receberão uma versão de alto desempenho do modelo com recursos adicionais
  • A versão de alto desempenho do modelo oferece geração de voz, melhor precisão de ditado e compreensão de linguagem natural mais robusta
  • A Apple não especificou quais dispositivos receberão o modelo de alto desempenho

Orquestrador de sistema

  • No centro da arquitetura reformulada está um novo orquestrador de sistema
  • O orquestrador de sistema coordena com segurança os recursos do Apple Intelligence em toda a plataforma da Apple
  • A Apple afirma que o orquestrador pode personalizar respostas com base no app ativo e na tarefa atual do usuário
  • Essa estrutura torna possível o que a Apple chamou de “verdadeira inteligência em todo o sistema”
Publicidade

Abordagem de privacidade

  • A Apple contrapôs sua abordagem à de concorrentes, dizendo que eles estão “correndo na frente” sem considerar os usuários
  • O Apple Intelligence depende de processamento no dispositivo e do Private Cloud Compute
  • Mantém-se a promessa de que os dados do usuário são usados apenas para executar solicitações imediatas e não podem ser acessados pela Apple nem por terceiros
  • A Apple acrescentou que especialistas externos podem verificar essas garantias de privacidade “a qualquer momento”
Publicidade

1 comentários

 
GN⁺ 2 시간 전
Opiniões no Hacker News
  • A forma como a Apple está correndo atrás da IA parece bem a cara da Apple: envolver ferramentas externas em uma arquitetura de privacidade, colocá-las no sistema operacional e transformar a camada de orquestração em produto
    É interessante pensar se o Private Cloud Compute e o roteamento on-device conseguem fazer os recursos de modelos de terceiros parecerem um sistema de primeira parte, sem vazar o contexto do usuário
    Se a Apple lidar bem com a fronteira Google-Apple, isso pode ser um movimento elegante; caso contrário, pode parecer só um frontend do Apple Intelligence com uma camada bonita de privacidade por cima do Gemini

    • Existe mesmo uma fronteira Google-Apple relevante na operação real? Se a Apple estiver comprando o direito de destilar seu próprio modelo Gemini e executá-lo em seus data centers, ou pelo menos em data centers sob seu controle, então não parece ser uma infraestrutura em que o Google tenha controle operacional
    • Eu não uso Android, mas eles mostraram bastante da integração profunda dentro dos apps, e acho que é aí que a mágica de verdade aparece
      Os chatbots de terceiros de hoje não conseguem esse tipo de integração e, mesmo que conseguissem, seria difícil confiar esse nível de permissão a outra empresa
    • Se for um frontend de privacidade para o Gemini, eu provavelmente usaria
      Garantias fortes de privacidade seriam melhores, mas ainda assim parece uma direção razoável
    • Tenho curiosidade sobre a experiência real de uso: como foi dito antes, se há vazamento de contexto, se a latência aumenta, se há impacto no preço etc.
      Devem ter considerado vários fatores, incluindo modelos menores, mas custo provavelmente também foi uma grande preocupação, e o Google parece ser o único provedor distribuindo tanta inferência de IA gratuita assim
      Essa mudança vai deixar ainda mais nebuloso quando e como consumidores ou funcionários devem pagar pelos custos de serviços de IA. Por exemplo, na apresentação mostraram tarefas de consumo, não de programação, mas será que eu poderia selecionar 5 arquivos e pedir para a Siri escrever um script em Python ou um pequeno app? Empresas vão simplesmente desativar os recursos de IA da Siri, ou poderão roteá-los para seu próprio sistema de auditoria e seus próprios provedores de IA?
    • A Apple diz que envolve a IA em uma arquitetura de privacidade, mas para usar o CarPlay é preciso ativar a Siri
  • Quero entender melhor o que de fato move o Apple Intelligence. É um modelo flagship do Gemini por trás de prompts próprios, é fine-tuning, ou a Apple pré-treinou seu próprio modelo com base no Gemini?
    Também quero saber se existe uma diferença significativa entre os modelos baseados em Gemini e os Apple Foundation Models. Não está claro se essa diferença muda entre modelos on-device e hospedados, se alguns rodam no Private Cloud Compute da Apple e outros em hardware do Google
    Depois explicaram isso com bastante detalhe no “keynote tech-talk”: [0]
    Segundo a Apple, são 5 modelos. No on-device há o AFM Core, um modelo on-device padrão de próxima geração com arquitetura densa, e o AFM Core Advanced, de arquitetura esparsa e multimodal nativa, que possibilita compreensão de imagem e voz mais expressiva
    No Private Cloud Compute há o AFM Cloud, o modelo principal de servidor otimizado para latência e custo, o AFM Cloud Image para geração e edição de imagens, e o AFM Cloud Pro, o modelo topo de linha para raciocínio complexo e tarefas de agente. O Cloud Pro tem qualidade no nível dos modelos de ponta do Gemini e roda em GPUs NVIDIA na nuvem do Google sob as garantias de privacidade do PCC da Apple
    Tudo exceto o Cloud Pro são modelos personalizados executados em Apple Silicon e, segundo a Apple, “refinados” com o Google Gemini. Sobre o Cloud Pro, a descrição é “o modelo mais poderoso, com qualidade semelhante à dos Gemini frontier models”, então, lendo nas entrelinhas, parece ser Gemini envolto numa camada da Apple
    [0]: https://9to5mac.com/2026/06/…

    • Hoje, o que move o Apple Intelligence é o modelo Apple Foundation 3B
      https://machinelearning.apple.com/research/introducing-apple...
      Se você tiver um Mac, pode testar isso por conta própria
      https://apfel.franzai.com/
    • O modelo local provavelmente é parecido com o Gemma e4b, que já pode ser baixado agora no app Google Edge Gallery para iOS e Android
      Uma versão mais poderosa, que só funcionaria em dispositivos com 12 GB de RAM, provavelmente seria um modelo semelhante, mas um pouco maior, ainda não divulgado
      O Google já anunciou antes que permitiria alugar hardware em seus próprios data centers para rodar o Gemini completo. É uma abordagem baseada em NVIDIA que permite que empresas treinem ou acessem os modelos sem enviar dados para os data centers do Google. O Private Compute também pode ser algo em que a Apple alugue esse tipo de equipamento em grande escala
    • Se entendi direito, a estrutura é que o provedor de nuvem selecionado roda a stack PCC no próprio hardware, e o provedor de computação fica responsável por cumprir as garantias de privacidade? Se for isso, parece ampliar a superfície potencial de ataque de segurança
    • O Gemini, pelo menos a versão pública gratuita, tem alucinação demais. Nesse nível, isso pode acabar sendo muito ruim para a Apple
  • Essa promessa do tipo “a Apple precisa ver os dados para realizar esse recurso, mas não tem como ver esses dados mesmo que queira” parece impossível
    Seria preciso liberar o iOS como open source, permitir que o usuário controle o dispositivo e hospede a inferência por conta própria, para poder verificar que não há tráfego de rede. Se for exatamente como dizem, então não deveria haver desvantagem em deixar o próprio usuário hospedar

  • Em essência, ainda parece estar fazendo o que o Google Assistant e a Siri já vinham fazendo há vários anos
    Não está muito claro o que se ganha a mais aqui

    • Só dá para dizer isso se você considerar que o Google Image Search e o Google Nano Banana são “a mesma coisa” apenas porque ambos geram imagens a partir de entrada de texto
      Da mesma forma, o código manual com milhões de linhas do Google Translate foi totalmente substituído por grandes modelos de linguagem que traduzem muito melhor
      Assistentes de IA baseados em grandes modelos de linguagem usam uma pilha tecnológica completamente diferente da programação lógica no estilo “if-then-else” em que a Siri antiga se baseava, e suas capacidades também são muito diferentes
  • É estranho que a Apple esteja se colocando em desvantagem ao escolher o Google como fornecedor em vez de Anthropic ou OpenAI
    Isso não torna mais difícil diferenciar do assistente dos celulares Android? Num tom mais cínico, se quisesse, o Google poderia fornecer à Apple uma versão inferior do Gemini para manter sua própria vantagem, não?
    Do ponto de vista do consumidor, independentemente da plataforma de celular escolhida, a base acaba sendo a mesma, e isso é ruim porque não há como evitar isso a não ser simplesmente não usar assistente nenhum

    • Em 99,9% dos trabalhos do “Apple Intelligence”, imagino que os modelos do Google vão se sair tão bem quanto os de outros laboratórios de ponta
      O Google já trabalhou mais do que a Anthropic ou a OpenAI em rodar grandes modelos de linguagem em dispositivos de borda
      A fonte também diz que a nova arquitetura é centrada nos Apple Foundation Models, desenvolvidos em conjunto com o Google, e ajustados para operar tanto on-device quanto em servidores por meio da infraestrutura Private Cloud Compute da Apple
      Isso pode significar que Google e Apple treinaram modelos sob medida para o hardware da Apple, provavelmente modelos on-device
    • Vejo de outro jeito. Parece que a Apple decidiu tratar modelos como commodity
      Se o Gemini virar um detalhe de implementação, fica aberta a possibilidade de trocar depois por Anthropic ou OpenAI sem que o usuário final saiba ou se importe. Então acho que eles estão criando alavancagem para negociações futuras
    • Pode ser que tenham escolhido estabilidade, achando que o Google vai aguentar por mais tempo que a Anthropic ou a OpenAI quando a tempestade começar
    • Isso é realmente tão diferente de a Apple usar o mecanismo de busca do Google como padrão?
    • Quando a Apple tomou essa decisão, a diferença de qualidade entre os modelos de Google, Anthropic e OpenAI não era tão grande quanto é agora
      E a Apple provavelmente queimou algumas pontes por causa do acordo que tinha firmado com a OpenAI um ano antes
  • Fui assinante pago do Claude por alguns anos, mas hoje em dia uso mais o app gratuito do Gemini no Android Pixel 9. Ele faz buscas muito bem como parte da resposta, o que é ótimo
    O modelo parece novo e atualizado. Ainda é uma questão em aberto se a Apple conseguirá integrar também essa função de busca

  • Posso estar errado, mas isso parece um golpe bem grande nas alegações de privacidade da Apple

    • A Apple voltou a enfatizar que o Apple Intelligence depende de processamento on-device e do Private Cloud Compute, e que os dados do usuário são usados apenas para executar imediatamente a solicitação, sem que a Apple ou terceiros possam acessá-los
      A Apple acrescentou que especialistas externos podem verificar essas garantias de privacidade “a qualquer momento”
    • Não vejo assim. Vai rodar nos servidores da Apple ou, no futuro, nos servidores do Google sob garantias de privacidade
      Você acha que o Google não protege a privacidade de grandes clientes pagantes?
      Usei produtos pagos do Google sem problemas por anos, e as garantias de privacidade sempre foram claras
  • Muita gente está deixando passar que o Google está muito mais à frente em IA de borda
    Já venho dizendo isso desde antes da febre do GPT, e os celulares Pixel já tinham legendas em tempo real, ou seja, transcrição de fala no próprio aparelho, há um bom tempo

    • A Apple envia iPhones com Neural Engine desde 2017
    • Quão boa é a oferta de IA offline, ou seja, on-device, do Google?
  • Esse movimento faz lembrar o iPhone original com o Google Maps embutido
    É uma estrutura em que compete com o Google, mas ainda usa a infraestrutura deles. Por que não escolheram outro fornecedor, como OpenAI ou Anthropic?

    • No começo escolheram a OpenAI para a Siri, e como esse acordo não foi adiante, imagino que algo tenha dado errado na relação com a OpenAI
      Talvez a OpenAI não tenha permitido que seus modelos rodassem nos servidores da Apple
    • Sendo justo, na época do iPhone original eles não eram concorrentes
      O Google era bom no trabalho web de backend, e a Apple pegava os dados em nuvem do Google e criava aplicativos locais excelentes. O app do YouTube era a mesma coisa
      Depois que o Google viu o iPhone antes do lançamento, mudou a direção do Android, e o Android, que originalmente era um hardware no estilo BlackBerry, virou para o rumo atual, começando a “guerra termonuclear”. Também é interessante que Steve Jobs tenha mostrado o iPhone desse jeito. Segundo Jobs, algo parecido tinha acontecido com Bill Gates, e isso acabou levando ao desenvolvimento do Windows
      Agora, 19 anos depois, pode ser hora de voltar a uma abordagem pragmática. Se a Apple não conseguir oferecer direito esse tipo de integração de IA no sistema operacional, corre o risco de perder usuários para o Android. Se de qualquer forma vai precisar pagar pelo modelo, faz sentido escolher o que achar melhor para o usuário. Isso parece vantajoso para a Apple, porque ajuda a manter os atuais usuários de iPhone e também pode atrair usuários de Android que querem os mesmos recursos, mas com melhor privacidade
      Neste ponto, pagar a OpenAI em vez do Google seria quase por rancor. Pode até haver motivos para isso, mas como toda a liderança mudou nos últimos 20 anos, seria como continuar uma guerra antiga. Ainda assim, antes de mostrar ao Google algo que ainda não foi anunciado, eu pensaria duas vezes
    • OpenAI e Anthropic não têm tanto capital quanto o Google
      A Apple já mantém todo mundo no próprio bolso por meio do ecossistema, então basta não estragar isso. Aqui a prioridade é mais estabilidade do que competição
    • O Google está mais perto de um conglomerado do que de uma empresa de integração horizontal consistente
      Cada divisão do Google opera quase como uma empresa da Fortune 500 por conta própria, e tende a agir de acordo com os próprios interesses
    • Quase toda big tech compete em algumas áreas e coopera em outras
      O Google provavelmente ofereceu as melhores condições. Um player em terceiro lugar acaba sacrificando margem para ganhar volume
  • Seria bom se a UE obrigasse a Apple a permitir que o usuário final escolhesse modelos externos
    Seria ótimo se um modelo local com foco em privacidade pudesse chamar qualquer modelo desejado, como Claude, Grok ou DeepSeek, por meio de um protocolo aberto bem definido
    Isso soa como uma arquitetura de sistema operacional de verdade. Dá para deixar de lado esse modelo de negócio baseado em rebates

    • A Apple não vai lançar isso na UE
    • E o certo é não querer isso, nem reforçar a fantasia de que reguladores da UE podem simplesmente ditar o design de produtos de empresas de fora da UE
      Obrigar a Apple a oferecer suporte a todo tipo de modelo arbitrário? É uma ideia absurdamente ruim