- O Apple Intelligence tem uma base poderosa com processamento no dispositivo e o Private Cloud Compute, mas a experiência real do produto fica mais próxima de melhorias em estilo de demonstração tecnológica do que de uma “bicicleta para a mente” que ajuda na criação
- A compreensão de contexto pessoal da Siri prometida pela Apple sugeria usos como “reproduzir o podcast que minha esposa enviou há alguns dias”, mas os recursos centrais repetidos na publicidade ainda não foram lançados
- O Private Cloud Compute se tornou um caso raro de computação confiável com verificação remota por apagar dados do usuário, verificar nós, publicar imagens públicas do sistema operacional e abrir o código central de segurança, mas os recursos construídos sobre essa base não acompanharam as expectativas
- Entre os recursos reais, o Math Notes é o mais satisfatório por processar cálculos com variáveis diretamente no Notes, enquanto Writing Tools, resumos de notificações, Clean Up e Image Playground mostram fraquezas em utilidade, precisão e controle criativo
- A IA generativa se parece mais com um detalhe de implementação de um produto maior do que com um produto independente, e o Apple Intelligence parece menos útil até do que uma integração direta com o Ollama no mesmo dispositivo
A filosofia de produto da Apple como “bicicleta para a mente”
- Em 1981, Steve Jobs comparou o computador a uma bicicleta para a mente humana, vendo-o como uma ferramenta que permite exercer mais criatividade com menos energia
- O Macintosh e o MacWrite, diferentemente de uma máquina de escrever ou da escrita à mão, permitiam ver o documento na tela e corrigi-lo com Backspace antes da impressão
- Os processadores de texto mudaram profundamente a forma de escrever documentos, e os produtos da Apple estabeleceram o padrão de que deveriam funcionar não como simples máquinas de cálculo, mas como uma extensão do corpo que torna a criação possível
- Por esse critério, a Apple se distingue como uma empresa que vende ferramentas de criação, e não “computadores que fazem trabalho de computador”
A visão prometida pelo Apple Intelligence
- Em junho de 2024, a Apple apresentou o Apple Intelligence como um conjunto de recursos para tornar o smartphone mais inteligente
- O exemplo da Siri atendendo a um pedido como “reproduzir o podcast que minha esposa enviou há alguns dias” mostrava a possibilidade de uma busca por contexto pessoal capaz de conectar relações, links e contexto de apps
- Se essa visão se concretizar, o usuário poderá pesquisar em linguagem natural sua vida digital espalhada por vários apps, e o telefone poderá executar tarefas em seu lugar
- A Apple apresentou a ideia de que todos os dispositivos Apple teriam acesso à inteligência (intelligence) assim como o Spotify fornece música ou uma API da AWS fornece computação como se fosse uma torneira
- Essa direção se aproxima da visão da “bicicleta para a mente”, em que o computador trabalha junto com o usuário para realizar o que ele deseja
Como os apps modernos afastam o usuário dos próprios dados
- Um grande problema dos apps modernos é que muitos funcionam como uma casca fina de serviços web
- Apps como Instagram ou Bluesky enviam requisições ao servidor, recebem respostas e exibem o conteúdo
- Sem sinal, pode se tornar difícil até agendar uma postagem, rever algo visto antes ou confirmar um conteúdo que acabou de ser publicado
- Signal e os apps da Apple são citados como exceções; fora isso, muitos apps afastam pouco a pouco o usuário dos próprios dados
- O texto de Ed Zitron critica como plataformas corroem a experiência do usuário com rastreadores de anúncios, anúncios em vídeo e pedidos de notificação em busca de crescimento e monetização
- O mercado não quer pagar diretamente por chat ou mídia social, e como o custo de operar esses serviços é muito alto, os dados do usuário passam a parecer um alvo fácil para monetização
Uma base forte chamada Private Cloud Compute
- O Apple Intelligence roda no dispositivo sempre que possível, e a Apple também pesquisa formas de executar grandes modelos de linguagem e outros modelos de IA no próprio aparelho
- Cálculos feitos no dispositivo ou em hardware visível ao usuário são muito mais fortes em termos de privacidade do que abordagens que envolvem requisições externas
- Na WWDC, a Apple afirmou que o Private Cloud Compute oferece, mesmo em requisições de rede, garantias de privacidade tão fortes quanto ou mais fortes que a computação local no dispositivo
- Visto pela experiência comum de operação de serviços web, o Private Cloud Compute precisa satisfazer ao mesmo tempo condições extremamente rigorosas
- Os dados do usuário são usados apenas para processar a requisição e depois são apagados
- A infraestrutura de balanceamento de carga não sabe quem fez a requisição nem para qual servidor ela foi
- Pesquisadores podem inspecionar e verificar o sistema e simulá-lo em um notebook
- Funcionários de SRE da Apple não têm acesso privilegiado aos nós do Private Cloud Compute, e o logging é minimizado no nível do compilador
- Um atacante não consegue descobrir de forma confiável qual nó está processando a requisição de um usuário específico
O lado duplo do modelo de segurança aberto e da natureza fechada
- A documentação técnica da Apple é citada como um caso raro em que uma equipe de produto de IA publica um modelo de segurança consistente
- No processo de montagem do hardware, cada etapa é radiografada e comparada com imagens de referência para impedir a ameaça de hardware não autorizado ser adicionado à placa do servidor
- O usuário pode montar uma cópia local de um nó do Private Cloud Compute para testar ataques, e a Apple paga recompensas caso vulnerabilidades sejam encontradas
- A autenticação do hardware envolve pessoas de vários departamentos internos da Apple sem relação entre si
- Nós do Private Cloud Compute revogam a própria autenticação quando a energia é removida, e o interruptor de intrusão do chassi do servidor está ligado à alimentação principal, de modo que abrir o servidor corta a energia e remove a autenticação do nó
- O ID do nó usado quando um dispositivo faz uma requisição ao Private Cloud Compute fica registrado, e o usuário pode verificar se o nó usado pelo aparelho ainda está autenticado
- As imagens do sistema operacional de produção podem ser baixadas publicamente e não são criptografadas
- Pacotes importantes do sistema operacional são separados entre código e dados, e não é possível misturar código em pacotes de dados nem o contrário
- A Apple publicou no GitHub o código-fonte das partes centrais de segurança do Private Cloud Compute
- Esse sistema chega perto do Santo Graal da computação confiável com verificação remota, mas, se fosse oferecido como sistema operacional para consumidores, seria um sistema extremamente fechado, sem acesso root, compilador ou depurador, capaz de rodar apenas software previamente definido
Os recursos que realmente saíram no fim de 2024
- O primeiro pacote de recursos do Apple Intelligence foi lançado no fim de outubro de 2024
- Os recursos oferecidos foram Writing Tools, resumos de notificações, páginas web e e-mails, Clean Up para remover objetos de fotos, busca com base no conteúdo das imagens, busca de documentos do dispositivo pela Siri e Math Notes no app Notes
- Depois, foram adicionados o Image Playground e a categorização de e-mails
- Os recursos de contexto pessoal repetidos na publicidade ainda não foram lançados
Math Notes: o recurso mais bem-sucedido
- O Math Notes é apontado como o recurso mais satisfatório do Apple Intelligence
- No app Notes, ao inserir um cálculo com variáveis como o seguinte, o resultado é preenchido automaticamente após o último sinal de igual
Rent = 2300
FamilySize = 2
Rent / FamilySize =
- Nesse exemplo, ele insere
1150
- É útil para cálculos básicos, uso de variáveis e estimativas aproximadas de receitas e despesas
- A avaliação é de que não há reclamações sobre o Math Notes
Writing Tools: resultado que substitui em vez de ajudar a criar
- Para usuários com muita experiência em escrita, o Writing Tools quase não tem utilidade e entrega apenas uma versão um pouco pior de algo que a própria pessoa já conseguiria fazer melhor
- O recurso passa a sensação dos maus efeitos colaterais de ferramentas de IA existentes, que não acrescentam ao processo criativo, mas o substituem
- O resultado aparece como um bloco opaco de texto atrás de opções limitadas como “deixar profissional” ou “transformar em tabela”, sem camadas nem possibilidade de ajuste fino
- Ao pedir na prática o resumo de um parágrafo, surgiu o erro “Writing Tools Unavailable: Certain capabilities are unavailable at this time. Try again later.”
- Pode ser útil para transformar uma fala longa em live em um rascunho inicial que sirva de ponto de partida para um texto, mas não se encaixa bem na tarefa de escrever o texto em si
- Pode ser mais útil para quem não tem muita experiência com inglês, mas para o autor sua utilidade foi pequena
Os problemas dos resumos de notificações, mensagens e e-mails
- A ideia dos resumos de notificações, de permitir passar rapidamente por muitas notificações de uma vez, parece boa em si
- Na implementação real, os casos de fracasso aparecem de forma gritante
- Mensagens de golpe podem ser resumidas como “entrega de encomenda atrasada por informação de endereço incompleta”, o que pode levar a sentir que é preciso agir imediatamente
- A BBC noticiou um caso em que o resumo de notificações levou pessoas a acreditar que um suspeito sob custódia havia tirado a própria vida
- Se o Apple Intelligence fica ativado e apenas o resumo de notificações é desativado, as notificações podem atrasar até 5 segundos
- Parte dos recursos de resumo não funcionava no iPhone e, por não serem úteis, acabaram ficando ativados apenas no MacBook para evitar atraso nas notificações
- No geral, há um acabamento típico da Apple, mas a sensação é de algo meio inacabado
Clean Up: uma ferramenta que altera a realidade da foto
- O Clean Up é um recurso para remover elementos indesejados de uma foto
- Para quem vê a foto como reflexo da realidade e distingue entre mudar a apresentação, como correção de cor ou recorte, e mudar o conteúdo da imagem, esse recurso é difícil de aceitar
- O caso histórico da edição de fotos de Stálin em que Nikolai Yezhov foi removido é usado como exemplo para explicar a natureza do Clean Up
- A ferramenta pode produzir uma imagem não do momento que realmente existiu, mas do momento que o usuário gostaria que tivesse existido
- Por esse motivo filosófico, o recurso não foi usado e não é avaliado em mais detalhes
Image Playground: resultados abaixo do padrão esperado de um produto Apple
- O Image Playground é um recurso de geração de imagens com prompts de texto e fotos de pessoas
- Imagens feitas com Stable Diffusion 1.5 e ComfyUI, em um fluxo complexo de difusão misturando 11 ou 12 modelos, são apresentadas como exemplo de um padrão elevado
- A imagem de um pôr do sol na torre de TV de Berlim Oriental criada pelo Image Playground pode até passar numa olhada rápida na tela do celular, mas mistura horários diferentes no céu e mostra linhas estranhas em janelas e decks
- Os bons exemplos são resultados fortemente selecionados; na maioria dos casos, algo como “taco smoking beer at a party” pode sair com grande desvio de forma e significado
- Ao usar a própria foto, podem surgir resultados desconfortáveis em proporções do rosto, olhos e outros detalhes
- O fato de a Apple ter lançado esse tipo de resultado como produto final parece o oposto da qualidade e do cuidado que se esperava da empresa
- O Genmoji é avaliado de forma parecida, como algo sem alma e vazio, mas não é tratado em detalhe por ser difícil extrair exemplos de mensagens de chat mantendo a qualidade
- É possível que outras empresas usando modelos com open weights produzam resultados melhores, e fica a frustração de não existir do lado da Apple algo como um IntelligenceKit para que desenvolvedores usem os modelos de forma criativa
IA generativa não é produto, e sim detalhe de implementação
- A IA generativa, por si só, parece mais um detalhe de implementação dentro de um produto maior do que um produto propriamente dito
- Mesmo que uma imagem da torre de TV de Berlim seja gerada em 1 ou 2 segundos, o usuário não ganha edição em camadas, correção da cor do céu nem controle criativo: recebe apenas uma saída final única
- Esse tipo de recurso pode servir para posts de baixo esforço em redes sociais, mas se parece mais com demonstração tecnológica do que com produto e, no padrão de 2025, recebe a avaliação de algo que teria sido impressionante em 2022
- As áreas em que a IA generativa é realmente útil são tarefas menos chamativas
- É mencionado um caso de pesquisa que usa IA generativa para classificar sensações difíceis de descrever surgidas em experiências de meditação, com mais notícias e plano de publicação de artigo até junho
Avaliação final: produto fraco sobre base forte
- O Apple Intelligence é avaliado como um produto fracassado do ponto de vista de implementação
- A base é muito forte
- todo dado possível é processado no dispositivo
- tarefas que não podem ser feitas no dispositivo usam as práticas rígidas de segurança do Private Cloud Compute
- o objetivo é fazer o máximo possível de processamento privado e criptografado
- O problema é que, mesmo tendo construído uma base próxima do Santo Graal da computação confiável com verificação remota, a experiência final para o usuário parece pior do que criar uma integração direta com Ollama no mesmo dispositivo
- Com o Ollama, é possível escolher modelos muito melhores do que os do Apple Intelligence e ainda preservar a privacidade, já que tudo roda no mesmo aparelho
- A comunidade open source precisa extrair o máximo de desempenho de hardware limitado e, por isso, consegue produzir resultados com lateral thinking usando tecnologia envelhecida e colocá-los em produção sem alterações
- O Apple Intelligence não entregou uma “bicicleta para a mente”, mas melhorias periféricas com cara de demonstração tecnológica, resultando em uma sensação de desperdício de um potencial que parecia infinito
- A exceção é o Math Notes, avaliado de forma fortemente positiva, a ponto de haver desejo de vê-lo também em outros apps de notas
Ainda não há comentários.