A arquitetura de memória do Claude é o oposto da do ChatGPT

(shloked.com)

6 pontos por GN⁺ 2025-09-12 | 2 comentários | Compartilhar no WhatsApp

O sistema de memória do Claude só é ativado quando o usuário o chama diretamente, e busca o histórico real de conversas em tempo real para retornar informações
Em contrapartida, o ChatGPT carrega automaticamente o perfil e o histórico do usuário a cada conversa, oferecendo uma experiência personalizada de imediato
Essas duas abordagens refletem diferenças no público-alvo e na filosofia de desenvolvimento do produto
Os usuários do Claude são mais centrados em desenvolvedores e profissionais, valorizando transparência, controle direto e privacidade
Recentemente, o Claude também passou a receber recursos de memória automática semelhantes aos do ChatGPT em contas de equipe e enterprise, mostrando que o campo do design de memória em IA está se expandindo rapidamente

Como funciona o sistema de memória do Claude

O sistema de memória do Claude tem duas características centrais

Começa em estado vazio no início de cada conversa, sem carregar previamente o perfil do usuário nem conversas anteriores
O recurso de memória só é ativado quando o usuário usa frases de chamada explícitas, como "me diga o que conversamos antes" ou "continue de onde paramos"

O Claude não usa um resumo gerado pela IA nem um perfil comprimido; ele consulta apenas o histórico real de conversas passadas em tempo real e usa essas informações
Quando a busca termina, o Claude integra os resultados para responder ao pedido do usuário ou continuar a discussão

Ferramenta Conversation Search

A ferramenta conversation_search pesquisa todo o histórico de conversas por palavra-chave ou tema
Por exemplo, se o usuário pedir "você lembra do que falamos sobre Chandni Chowk?", o Claude encontra várias conversas relacionadas ao tema, integra isso e fornece um resumo
Se forem perguntados vários temas ao mesmo tempo (por exemplo: Michelangelo, Chainflip, Solana), ele faz buscas separadas em sequência para cada um e retorna o conteúdo com links
Os parâmetros de conversation_search incluem número máximo de resultados, consulta de busca etc.
- Ex.: max_results (1~10), query (palavra-chave de busca)

Ferramenta Temporal Chat Retrieval

A ferramenta recent_chats acessa o histórico de conversas com base no tempo
Se o usuário pedir algo como "me diga o conteúdo das últimas 10 conversas", ela localiza as conversas mais recentes em ordem e fornece um resumo
Também é possível buscar por período específico, como em "sobre o que falamos na última semana de novembro de 2024?"
Os parâmetros de recent_chats incluem after/before (início/fim do período), n (número de conversas, 1~20) e sort_order (ordem crescente/decrescente)

Comparação entre ChatGPT e Claude

Até o ano passado, os principais recursos oferecidos por ChatGPT e Claude eram parecidos, mas agora a direção dos produtos se distanciou bastante

O ChatGPT evoluiu como um produto de consumo voltado ao mercado de massa, usado por estudantes, pais, pessoas com hobbies e usuários de vários perfis
- Em todas as conversas, os componentes de memória são carregados automaticamente, oferecendo uma experiência de personalização imediata e sem esforço
- Com base em um perfil detalhado do usuário, isso pode ser aproveitado para recomendações futuras de recursos, funcionalidades personalizadas e monetização
O Claude foi desenvolvido para um público centrado em desenvolvedores, engenheiros e profissionais
- Os usuários entendem como o algoritmo funciona e escolhem claramente quando chamar a memória
- Mais do que perfilização ou automação, valorizam funcionalidade como ferramenta, previsibilidade e privacidade

Assim, os sistemas de memória dos dois serviços refletem diretamente as diferenças de público e de filosofia de desenvolvimento

A diversidade no design de memória para IA

Os sistemas de memória diametralmente opostos de ChatGPT e Claude mostram como o campo de design de memória para IA é bastante diverso

Não existe resposta certa nem solução universal para a abordagem de memória, e é essencial projetar de trás para frente com base nas necessidades e objetivos reais dos usuários
Como a história de uso de ferramentas de IA ainda não tem nem 3 anos, ainda faltam boas práticas consolidadas para lidar com dados acumulados e privacidade ao usar o mesmo assistente de IA por longos períodos
Hoje, vários apps de IA estão experimentando abordagens próprias e distintas de memória, enquanto os modelos de base também ficam mais poderosos a cada semana
Nesse processo, não há uma única resposta ideal, e as tentativas e experimentos continuam

Atualização recente: introdução da memória automática no Claude

No dia em que este texto foi publicado, a Anthropic anunciou o recurso de memória automática do Claude para contas Team/Enterprise

Esse recurso, semelhante à abordagem do ChatGPT, cria automaticamente resumos de memória com base em contexto de trabalho, padrões de trabalho e informações por projeto
Uma memória independente é criada para cada projeto do Claude, e o usuário pode ver e editar diretamente o que o Claude lembra
O autor ainda não recebeu o recurso em sua assinatura pessoal Pro Max, então a avaliação da funcionalidade ainda não foi feita
Futuramente, pretende publicar uma análise adicional comparando esse recurso com a memória baseada em busca existente e com o ChatGPT

2 comentários

GN⁺ 2025-09-12

Comentários do Hacker News

As diferenças de implementação acabam vindo dos objetivos de negócio
O ChatGPT claramente mira monetização por anúncios e links de afiliados, e sua implementação de memória também está focada em criar perfis de usuário
Já a implementação de memória do Claude está mais próxima de um objetivo de longo prazo ligado a interações passadas e acesso a abstrações
Ela foi projetada para permitir buscar conversas de forma parecida com a maneira como humanos acessam memórias, e no futuro, com aprendizado por reforço, talvez possa lembrar erros apontados pelo usuário ou extrair abstrações de conversas passadas para lidar com tarefas de forma proativa
No fim, o ChatGPT tenta lembrar do próprio usuário, enquanto o Claude se concentra no histórico de interações individuais
- Se isso fosse AGI, poderia gerar receita sem anúncios, mas uma nova empresa tipo Google precisa de anúncios
  Tenho a sensação de que há uma discrepância entre o discurso e o comportamento real
- Também não acredito que a Anthropic deixará de oferecer publicidade personalizada
- Supondo que um usuário use LLMs com frequência para temas a, b, c e menos para d, e, f
  em alguns temas como b, c, f a OpenAI poderia lucrar com anúncios interruptivos (tela cheia, mais de 30 segundos)
  Isso seria possível apenas analisando os temas
  Se a OpenAI pudesse analisar algo como 1000 sessões de chat e codificação para maximizar a receita, induzindo o usuário a conseguir emprego em uma empresa específica ou comprar um carro de outra empresa, então nesse processo poderia ajustar não só anúncios interruptivos, mas também a qualidade ou o conteúdo das respostas
  Isso parece uma situação suficientemente realista e distópica
  Por outro lado, se a DeepSeek operar sem anúncios, o padrão para LLMs de código fechado ganharem participação de mercado ficará muito mais alto
  No fim, LLMs serão como qualquer outro produto, e os usuários pagarão de acordo com a qualidade, querendo níveis diferentes dela
  Como anúncios podem prejudicar a confiabilidade das respostas da IA, acho que anúncios em tela cheia são o desfecho mais realista
- Fico curioso sobre por que você vê uma direção tão clara rumo a anúncios
  O ChatGPT não é uma rede social, então não precisa ser monetizado da mesma forma
  Já gera receita suficiente com assinaturas, enterprise, negócios e API
Aponta que o link do texto de análise sobre a implementação de memória do ChatGPT estava errado e compartilha o link correto
Eu estava curioso sobre como funcionava a implementação de memória do ChatGPT, e é muito interessante ver uma abordagem completamente diferente da do Claude
O método do Claude parece mais adequado para resolver tarefas técnicas, enquanto o ChatGPT parece mais favorável para conversas cotidianas e integração com anúncios
Em algum momento esse tipo de memória baseada em linguagem vai ficar ultrapassado, e alguém encontrará uma forma de armazenar/recuperar memórias codificadas que vá além da expressão linguística
Isso talvez seja a última grande descoberta rumo à AGI
- Não concordo com a afirmação de que isso seria a última grande descoberta para AGI
  Os LLMs atuais não entendem conceitos; na prática não possuem a função de “entender” e, em essência, são cadeias de Markov sofisticadas
  Acho que inteligência de verdade é uma pré-condição para AGI
- Acho que a lista de conversas recentes é parecida com a do Claude no sentido de que não é memória real, mas uma forma de compressão das conversas acessada só quando necessário
  Parece que a memória do ChatGPT só permite colocar no contexto a Memory real, que seria um resumo por entidade
- O ChatGPT está tentando cobrir tudo, de conversas cotidianas a tarefas técnicas, então essa estratégia está funcionando bem
  E também levanta a opinião de que resumos de conversas passadas ou embeddings não poderiam ser considerados uma forma codificada de armazenamento de memória
- Eu não quero AGI
  Isso me faz pensar em como seria possível fazer uma AGI obedecer comandos
Diz que está satisfeito com a implementação de memória do Claude, mas deixou a memória do ChatGPT desativada
Como usa o ChatGPT para coisas muito variadas, pareceu estranho que ele tentasse conectar conteúdos sem relação de forma sem sentido
- A memória do ChatGPT é o recurso mais conveniente e é isso que me faz continuar usando
  Quero personalização e referência às informações necessárias
  Por exemplo, se ele guardar informações sobre um projeto, depois não preciso explicar o contexto toda vez, o que melhora muito a qualidade de vida
  Mas não gosto muito da forma como memórias de conversas em segundo plano são criadas sem que eu tenha controle direto
- Pelo contrário, a função do ChatGPT de puxar informações automaticamente da memória parece muito mais conveniente
- O motivo de eu ter desligado a memória foi que antes ele guardou informações falsas e continuava trazendo isso de volta repetidamente
- Acho valioso poder controlar quando ele vai trazer conteúdo de conversas anteriores
  No ChatGPT, conteúdos antigos indesejados acabam se misturando sem necessidade e ficam inúteis
- É curioso que o ChatGPT não consiga lembrar nem o básico
  Já usei vários tutores de IA para aprender idiomas, e o ChatGPT foi o melhor
  Mas eu precisava repetir o tempo todo “fale devagar”, e mesmo dizendo para aplicar essa regra à conversa inteira isso não era possível
  Fora isso, há outros pontos em que a memória não funciona direito
Em breve a forma de memória do ChatGPT vai mudar
Links de referência: X.com - notícia sobre a mudança na memória, anúncio oficial da Anthropic
- Se o sistema de memória mudar, acho que vou sentir falta
Compartilha a experiência de ter escrito diretamente sobre memória do ChatGPT e histórico de chats
Também inclui um prompt para despejar informações manualmente
Link relacionado
Como sempre quero controle preciso da entrada, costumo desligar totalmente a memória
Quero remover todos os system prompts, treinamentos etc. e usar apenas prompts escritos por mim
Questiona se as informações descobertas perguntando diretamente ao ChatGPT são confiáveis ou se seriam alucinações gerativas
Acha que não há motivo para um LLM saber como ele mesmo funciona, nem que tenha recebido materiais de treinamento sobre isso
- Perguntar a um LLM como ele funciona não ajuda muito, mas perguntar sobre a assinatura das funções/ferramentas que ele pode usar costuma funcionar bem
  Isso porque essas informações de ferramentas ficam descritas com bastante detalhe no system prompt
Diz que o Claude recupera memórias consultando apenas o histórico original das conversas
Não há resumos gerados por IA nem perfis comprimidos; ele busca conversas reais passadas em tempo real
A ausência de resumos, perfis e grafos de conhecimento não é uma funcionalidade avançada, mas um sinal de que não funciona bem
Por exemplo, talvez lembre algo específico como "Chandni Chowk", mas não consiga encontrar bem uma expressão vaga como “meu colega com quem tive problemas”
Pergunta quais seriam os obstáculos ao usar um repositório de memória externa via tool calling ou MCP
Quer saber se estão reforçando, com RL, padrões de uso de memória
Do ponto de vista de privacidade de dados, o LLM de qualquer forma acaba sabendo da informação na inferência, mas a pessoa não quer inseri-la diretamente
Ex.: "Interesses: MacOS, bondage, discipline, Baseball"
- Conta que na primavera criou por diversão uma ferramenta MCP que armazenava memórias em um banco SQLite
  Na época, mesmo com insistência via prompt, o Claude não queria usar memórias espontaneamente
  Era preciso instruir explicitamente toda vez para verificar ou salvar memória, então a utilidade era baixa
  Repositório relacionado
Ficou confuso ao ler este texto
Não ficou claro se o autor acha que prompts são inseridos mesmo com a memória desligada
No meu caso, com a memória desativada, não há nenhum metadado com conversas recentes ou informações de preferência sendo inserido, e tudo permanece como conversas totalmente independentes
Não sei se a confusão veio do fato de ele ter alternado entre ligar e desligar a memória durante os testes, ou se fui eu que não li o texto direito

roxie 2025-09-13

De repente, todos os pontos desapareceram