- O sistema de memória do Claude só é ativado quando o usuário o chama diretamente, e busca o histórico real de conversas em tempo real para retornar informações
- Em contrapartida, o ChatGPT carrega automaticamente o perfil e o histórico do usuário a cada conversa, oferecendo uma experiência personalizada de imediato
- Essas duas abordagens refletem diferenças no público-alvo e na filosofia de desenvolvimento do produto
- Os usuários do Claude são mais centrados em desenvolvedores e profissionais, valorizando transparência, controle direto e privacidade
- Recentemente, o Claude também passou a receber recursos de memória automática semelhantes aos do ChatGPT em contas de equipe e enterprise, mostrando que o campo do design de memória em IA está se expandindo rapidamente
Como funciona o sistema de memória do Claude
O sistema de memória do Claude tem duas características centrais
- Começa em estado vazio no início de cada conversa, sem carregar previamente o perfil do usuário nem conversas anteriores
- O recurso de memória só é ativado quando o usuário usa frases de chamada explícitas, como "me diga o que conversamos antes" ou "continue de onde paramos"
O Claude não usa um resumo gerado pela IA nem um perfil comprimido; ele consulta apenas o histórico real de conversas passadas em tempo real e usa essas informações
Quando a busca termina, o Claude integra os resultados para responder ao pedido do usuário ou continuar a discussão
Ferramenta Conversation Search
- A ferramenta conversation_search pesquisa todo o histórico de conversas por palavra-chave ou tema
- Por exemplo, se o usuário pedir "você lembra do que falamos sobre Chandni Chowk?", o Claude encontra várias conversas relacionadas ao tema, integra isso e fornece um resumo
- Se forem perguntados vários temas ao mesmo tempo (por exemplo: Michelangelo, Chainflip, Solana), ele faz buscas separadas em sequência para cada um e retorna o conteúdo com links
- Os parâmetros de
conversation_searchincluem número máximo de resultados, consulta de busca etc.- Ex.:
max_results(1~10),query(palavra-chave de busca)
- Ex.:
Ferramenta Temporal Chat Retrieval
- A ferramenta recent_chats acessa o histórico de conversas com base no tempo
- Se o usuário pedir algo como "me diga o conteúdo das últimas 10 conversas", ela localiza as conversas mais recentes em ordem e fornece um resumo
- Também é possível buscar por período específico, como em "sobre o que falamos na última semana de novembro de 2024?"
- Os parâmetros de
recent_chatsincluemafter/before(início/fim do período),n(número de conversas, 1~20) esort_order(ordem crescente/decrescente)
Comparação entre ChatGPT e Claude
Até o ano passado, os principais recursos oferecidos por ChatGPT e Claude eram parecidos, mas agora a direção dos produtos se distanciou bastante
- O ChatGPT evoluiu como um produto de consumo voltado ao mercado de massa, usado por estudantes, pais, pessoas com hobbies e usuários de vários perfis
- Em todas as conversas, os componentes de memória são carregados automaticamente, oferecendo uma experiência de personalização imediata e sem esforço
- Com base em um perfil detalhado do usuário, isso pode ser aproveitado para recomendações futuras de recursos, funcionalidades personalizadas e monetização
- O Claude foi desenvolvido para um público centrado em desenvolvedores, engenheiros e profissionais
- Os usuários entendem como o algoritmo funciona e escolhem claramente quando chamar a memória
- Mais do que perfilização ou automação, valorizam funcionalidade como ferramenta, previsibilidade e privacidade
Assim, os sistemas de memória dos dois serviços refletem diretamente as diferenças de público e de filosofia de desenvolvimento
A diversidade no design de memória para IA
Os sistemas de memória diametralmente opostos de ChatGPT e Claude mostram como o campo de design de memória para IA é bastante diverso
- Não existe resposta certa nem solução universal para a abordagem de memória, e é essencial projetar de trás para frente com base nas necessidades e objetivos reais dos usuários
- Como a história de uso de ferramentas de IA ainda não tem nem 3 anos, ainda faltam boas práticas consolidadas para lidar com dados acumulados e privacidade ao usar o mesmo assistente de IA por longos períodos
- Hoje, vários apps de IA estão experimentando abordagens próprias e distintas de memória, enquanto os modelos de base também ficam mais poderosos a cada semana
- Nesse processo, não há uma única resposta ideal, e as tentativas e experimentos continuam
Atualização recente: introdução da memória automática no Claude
No dia em que este texto foi publicado, a Anthropic anunciou o recurso de memória automática do Claude para contas Team/Enterprise
- Esse recurso, semelhante à abordagem do ChatGPT, cria automaticamente resumos de memória com base em contexto de trabalho, padrões de trabalho e informações por projeto
- Uma memória independente é criada para cada projeto do Claude, e o usuário pode ver e editar diretamente o que o Claude lembra
- O autor ainda não recebeu o recurso em sua assinatura pessoal Pro Max, então a avaliação da funcionalidade ainda não foi feita
- Futuramente, pretende publicar uma análise adicional comparando esse recurso com a memória baseada em busca existente e com o ChatGPT
2 comentários
Comentários do Hacker News
As diferenças de implementação acabam vindo dos objetivos de negócio
O ChatGPT claramente mira monetização por anúncios e links de afiliados, e sua implementação de memória também está focada em criar perfis de usuário
Já a implementação de memória do Claude está mais próxima de um objetivo de longo prazo ligado a interações passadas e acesso a abstrações
Ela foi projetada para permitir buscar conversas de forma parecida com a maneira como humanos acessam memórias, e no futuro, com aprendizado por reforço, talvez possa lembrar erros apontados pelo usuário ou extrair abstrações de conversas passadas para lidar com tarefas de forma proativa
No fim, o ChatGPT tenta lembrar do próprio usuário, enquanto o Claude se concentra no histórico de interações individuais
Tenho a sensação de que há uma discrepância entre o discurso e o comportamento real
em alguns temas como b, c, f a OpenAI poderia lucrar com anúncios interruptivos (tela cheia, mais de 30 segundos)
Isso seria possível apenas analisando os temas
Se a OpenAI pudesse analisar algo como 1000 sessões de chat e codificação para maximizar a receita, induzindo o usuário a conseguir emprego em uma empresa específica ou comprar um carro de outra empresa, então nesse processo poderia ajustar não só anúncios interruptivos, mas também a qualidade ou o conteúdo das respostas
Isso parece uma situação suficientemente realista e distópica
Por outro lado, se a DeepSeek operar sem anúncios, o padrão para LLMs de código fechado ganharem participação de mercado ficará muito mais alto
No fim, LLMs serão como qualquer outro produto, e os usuários pagarão de acordo com a qualidade, querendo níveis diferentes dela
Como anúncios podem prejudicar a confiabilidade das respostas da IA, acho que anúncios em tela cheia são o desfecho mais realista
O ChatGPT não é uma rede social, então não precisa ser monetizado da mesma forma
Já gera receita suficiente com assinaturas, enterprise, negócios e API
Aponta que o link do texto de análise sobre a implementação de memória do ChatGPT estava errado e compartilha o link correto
Eu estava curioso sobre como funcionava a implementação de memória do ChatGPT, e é muito interessante ver uma abordagem completamente diferente da do Claude
O método do Claude parece mais adequado para resolver tarefas técnicas, enquanto o ChatGPT parece mais favorável para conversas cotidianas e integração com anúncios
Em algum momento esse tipo de memória baseada em linguagem vai ficar ultrapassado, e alguém encontrará uma forma de armazenar/recuperar memórias codificadas que vá além da expressão linguística
Isso talvez seja a última grande descoberta rumo à AGI
Os LLMs atuais não entendem conceitos; na prática não possuem a função de “entender” e, em essência, são cadeias de Markov sofisticadas
Acho que inteligência de verdade é uma pré-condição para AGI
Parece que a memória do ChatGPT só permite colocar no contexto a Memory real, que seria um resumo por entidade
E também levanta a opinião de que resumos de conversas passadas ou embeddings não poderiam ser considerados uma forma codificada de armazenamento de memória
Isso me faz pensar em como seria possível fazer uma AGI obedecer comandos
Diz que está satisfeito com a implementação de memória do Claude, mas deixou a memória do ChatGPT desativada
Como usa o ChatGPT para coisas muito variadas, pareceu estranho que ele tentasse conectar conteúdos sem relação de forma sem sentido
Quero personalização e referência às informações necessárias
Por exemplo, se ele guardar informações sobre um projeto, depois não preciso explicar o contexto toda vez, o que melhora muito a qualidade de vida
Mas não gosto muito da forma como memórias de conversas em segundo plano são criadas sem que eu tenha controle direto
No ChatGPT, conteúdos antigos indesejados acabam se misturando sem necessidade e ficam inúteis
Já usei vários tutores de IA para aprender idiomas, e o ChatGPT foi o melhor
Mas eu precisava repetir o tempo todo “fale devagar”, e mesmo dizendo para aplicar essa regra à conversa inteira isso não era possível
Fora isso, há outros pontos em que a memória não funciona direito
Em breve a forma de memória do ChatGPT vai mudar
Links de referência: X.com - notícia sobre a mudança na memória, anúncio oficial da Anthropic
Compartilha a experiência de ter escrito diretamente sobre memória do ChatGPT e histórico de chats
Também inclui um prompt para despejar informações manualmente
Link relacionado
Como sempre quero controle preciso da entrada, costumo desligar totalmente a memória
Quero remover todos os system prompts, treinamentos etc. e usar apenas prompts escritos por mim
Questiona se as informações descobertas perguntando diretamente ao ChatGPT são confiáveis ou se seriam alucinações gerativas
Acha que não há motivo para um LLM saber como ele mesmo funciona, nem que tenha recebido materiais de treinamento sobre isso
Isso porque essas informações de ferramentas ficam descritas com bastante detalhe no system prompt
Diz que o Claude recupera memórias consultando apenas o histórico original das conversas
Não há resumos gerados por IA nem perfis comprimidos; ele busca conversas reais passadas em tempo real
A ausência de resumos, perfis e grafos de conhecimento não é uma funcionalidade avançada, mas um sinal de que não funciona bem
Por exemplo, talvez lembre algo específico como "Chandni Chowk", mas não consiga encontrar bem uma expressão vaga como “meu colega com quem tive problemas”
Pergunta quais seriam os obstáculos ao usar um repositório de memória externa via tool calling ou MCP
Quer saber se estão reforçando, com RL, padrões de uso de memória
Do ponto de vista de privacidade de dados, o LLM de qualquer forma acaba sabendo da informação na inferência, mas a pessoa não quer inseri-la diretamente
Ex.: "Interesses: MacOS, bondage, discipline, Baseball"
Na época, mesmo com insistência via prompt, o Claude não queria usar memórias espontaneamente
Era preciso instruir explicitamente toda vez para verificar ou salvar memória, então a utilidade era baixa
Repositório relacionado
Ficou confuso ao ler este texto
Não ficou claro se o autor acha que prompts são inseridos mesmo com a memória desligada
No meu caso, com a memória desativada, não há nenhum metadado com conversas recentes ou informações de preferência sendo inserido, e tudo permanece como conversas totalmente independentes
Não sei se a confusão veio do fato de ele ter alternado entre ligar e desligar a memória durante os testes, ou se fui eu que não li o texto direito
De repente, todos os pontos desapareceram