Enciclopédia pessoal

(whoami.wiki)

18 pontos por GN⁺ 2026-03-26 | 1 comentários | Compartilhar no WhatsApp

Ao organizar 1.351 fotos de família encontradas na casa da avó, foi criada uma wiki pessoal baseada em MediaWiki para estruturar memórias
Ao conectar fotos, pessoas e acontecimentos em formato de wiki, a história da família e a história pessoal foram reconstruídas em forma de artigos
Depois, vários rastros digitais, como Google Photos, histórico de localização, transações financeiras e dados de reconhecimento musical, foram integrados para testar a geração automática de páginas com Claude Code e modelos de linguagem
Nesse processo, o modelo reconstituiu lacunas da memória e reorganizou os fluxos de conversas, viagens e amizades em narrativas baseadas em dados
Como resultado, isso evoluiu para o projeto open source whoami.wiki, propondo um sistema em que cada pessoa pode explorar e possuir seus próprios dados como uma enciclopédia

O início do projeto de enciclopédia pessoal

Na primeira visita à casa da avó após a pandemia, foram encontradas e organizadas 1.351 fotos antigas
- As fotos iam da juventude dos avós até os anos de ensino fundamental II do próprio autor
- A classificação inicial foi feita com base em atributos físicos, como tipo de filme e proporção das fotos
Ao organizar as fotos, surgiram fragmentos de memórias, mas a ordem e o contexto não estavam claros
- Como eram fotos de uma época sem metadados EXIF, era difícil determinar a ordem cronológica
Reorganizando as fotos junto com a avó, foram registrados em relato oral as memórias da época do casamento
- Foram anotados nomes de pessoas e acontecimentos, e algumas pessoas foram identificadas como parentes na juventude
As anotações foram organizadas e o MediaWiki foi executado localmente, com edição no formato real da Wikipédia
- Foram criadas páginas estruturadas com infobox, texto principal, legendas de fotos e links para pessoas
- Elementos relacionados, como reformas legais, cerimônias e lugares, foram ligados a páginas reais da Wikipédia

Reconstituição da memória com software de wiki

Em apenas dois dias, o contexto histórico das fotos foi organizado em artigos completos
- Isso mostrou na prática que o software de wiki é uma ferramenta poderosa para preservar conhecimento e mídia
Nos meses seguintes, o trabalho foi expandido para transformar todo o acervo de fotos de família em páginas de wiki
- Com conselhos da comunidade r/genealogy, o método de registro de história oral foi aprimorado
- A eficiência da edição aumentou com transcrição de voz e modelos de linguagem
Graças ao formato wiki, ficou fácil entender as conexões entre acontecimentos e pessoas
- Por exemplo, descobriu-se que a cantora do casamento dos avós era a enfermeira que realizou o parto do autor

Combinação de dados digitais com modelos de linguagem

Depois, o projeto foi expandido para as fotos digitais do Google Photos
- Com metadados EXIF, foi possível usar data, hora e informações de localização
Para 625 fotos de uma viagem em família de 2012, foi pedido ao Claude Code que gerasse páginas de wiki
- A exploração das imagens foi feita com referência a contact sheets criadas com ImageMagick
- O modelo reconstituiu lugares e atividades apenas com informações visuais e timestamps
- Incluindo descrições detalhadas de meios de transporte, locais visitados e identificação de pessoas
Às versões iniciais geradas, foi adicionada uma lista de episódios pessoais para completar a narrativa

Experimentos de integração de dados compostos

Depois, isso foi ampliado para os dados de uma viagem à Cidade do México em 2022
- Foram integradas 291 fotos, 343 vídeos, além de histórico de localização do Google Maps, corridas de Uber, transações bancárias e registros do Shazam
Principais tarefas realizadas pelo Claude Code
1. Analisar em conjunto transações bancárias e dados de localização para identificar os restaurantes visitados
2. Usar registros de pagamento de ingressos para identificar os times e o nome do campeonato de uma partida de futebol
3. Usar o histórico de corridas do Uber para determinar horários e locais de deslocamento
4. Usar registros do Shazam para descrever os gêneros musicais de cada lugar
5. Encontrar, em quadros de vídeo, uma cena de violão durante o jantar e inseri-la na página
Foram aproveitados integralmente os recursos de páginas de discussão, categorias e histórico de edições do MediaWiki
- Sempre que novos dados eram adicionados, o histórico de revisões se acumulava como se houvesse um editor de wiki real

Enciclopedização de dados pessoais

Com o tempo, o modelo passou a preencher lacunas da memória
- Ao cruzar várias fontes de dados, o modelo restaurava fatos que já haviam sido esquecidos
Foram analisados cerca de 100 mil mensagens e notas de voz de arquivos do Facebook, Instagram e WhatsApp
- Das conversas com amigos, foram extraídos os fluxos das amizades e acontecimentos da vida, transformados em páginas
- Os amigos liam essas páginas e se envolviam a ponto de ler tudo com atenção
Com isso, o projeto deixou de ser apenas uma história familiar e evoluiu para a construção de uma enciclopédia pessoal (personal encyclopedia)
- Foi concluído um sistema estruturado e interligado de registro pessoal baseado em dados

Divulgação do projeto whoami.wiki

Com base nessa experiência, whoami.wiki foi publicado como open source
- Baseado em MediaWiki, gera automaticamente páginas de wiki a partir de dados pessoais
- O usuário fornece a exportação dos próprios dados, e o modelo de linguagem escreve o rascunho inicial
- Execução local, preservação da propriedade dos dados e independência de modelo garantidas
Qualquer tema pessoal — casamento, amigos, viagens — pode ser registrado no mesmo formato de uma wiki pública
A experiência de explorar as páginas prontas oferece uma diversão que lembra a timeline inicial do Facebook
Mais importante do que a tecnologia é a redescoberta das pessoas e das memórias
- Ao registrar a vida da avó, houve uma nova percepção de sua força e resiliência
- Ao revisitar as relações com amigos, foram recuperados gratidão e senso de conexão
O projeto ainda está em estágio inicial, e qualquer pessoa pode começar diretamente pela documentação de instalação
- Os dados continuam pertencendo ao usuário e ficam em uma estrutura legível por qualquer modelo
- O projeto segue sendo melhorado continuamente com feedback de colaboradores

1 comentários

GN⁺ 2026-03-26

Comentários do Hacker News

Acho este projeto realmente incrível e uma forma interessante de preservar a história da família
Mas a parte em que a IA entra me deixou com sentimentos complexos
Houve um certo amargor, como se o trabalho artesanal estivesse sendo empurrado para fora pela fábrica, e ao mesmo tempo ver a IA cruzando extratos bancários, ingressos e até histórico de músicas pareceu um pouco distópico
Ainda assim, no geral, foi uma tentativa extremamente impressionante
- Obrigado :)
  No começo, eu mesmo fazia toda a edição e montava o material como um historiador
  Depois, quando comecei os experimentos com agentes, o ritmo de trabalho acelerou muito, mas ainda assim passei muito tempo como um “colaborador de wiki”, pensando no que manter e no que apagar
  Ao mesmo tempo, essa experiência me fez perceber de forma muito concreta a importância de proteger os dados pessoais. Estamos deixando rastros digitais demais
- Normalmente acho desagradável quando a IA tenta imitar humanos, mas desta vez foi diferente
  Como a “bicicleta para a mente” de que Steve Jobs falava, a tecnologia funcionou como uma ferramenta para ajudar o trabalho humano
  Fazia tempo que eu não via a tecnologia ajudando uma criação humana de um jeito tão humano, e isso me trouxe de volta aquela empolgação de antigamente
- Penso de forma parecida. Como dispositivo de enquadramento para lidar com a história da família, é excelente, mas rejeito de forma instintiva a ideia de a IA virar a narradora
  Não vejo problema moral em um LLM organizar informações, mas me incomoda que um modelo de uma grande empresa fale no lugar da narrativa pessoal de alguém
- Aqui, a IA pareceu apenas uma colaboradora
  O autor ficou com as partes interessantes, e a IA com o trabalho chato de conectar os dados; acho ideal essa divisão de papéis
- Tive exatamente a mesma reação. Registrar diretamente os membros da família e os acontecimentos é ótimo, mas quando a IA faz tudo sozinha o encanto desaparece
  1. Some o toque curatorial
  2. A subjetividade da memória é importante, mas a IA tenta corrigir isso
  3. No fim, o resultado fica sem alma
Minha esposa e eu, todo Ano-Novo, juntamos umas 50 folhas de papel e fazemos um pequeno caderno
Encadernamos com retalhos de roupa gasta e decoramos com objetos de lembrança, como caixinhas de fósforo de viagens
Ao longo do ano, escrevemos o que aprendemos, brigas e reconciliações, receitas, pensamentos etc., deixando aquilo como um registro daquele ano
O motivo de fazermos isso à mão em vez de usar ferramentas de IA é que o processo é um ritual significativo e prazeroso
Fica ainda mais bonito pensando que nossos filhos vão ler isso no futuro
- Eu faço algo parecido, imprimindo fotos com uma impressora Instax e colando no diário
  Como aqueles antigos livros de receita marcados pelo uso, um livro com respingos de tinta tem muito mais charme
- Isso se chama commonplace book. Jillian Hess tem bastante pesquisa sobre o tema
- Que ideia incrível, quero tentar fazer isso com minha esposa e meus filhos
- É tocante, mas honestamente acho que eu não teria tanta energia
Eu também comecei um projeto assim em um livro impresso de verdade
Estou diagramando milhares de fotos no Scribus e montando livros por ano
Gosto da ideia de que, mesmo depois que eu morrer, meus rastros continuem existindo fisicamente
Pretendo prender um cartão SD na folha de rosto para deixar vídeos junto
Além disso, consegui uma impressora Canon Selphy usada e imprimo fotos em casa. As cores não são perfeitas, mas dá uma satisfação vê-las penduradas na parede
- Eu gosto de fazer zines. Impressão a laser dura bem ao sol, e lápis é o que mais dura, pelo que vi
  Um grampeador 360 graus é o melhor para encadernação rápida
- Eu faço algo parecido por e-mail. Quando meu filho nasceu, criei um endereço de e-mail para que os familiares pudessem mandar mensagens e fotos para ele
  É um projeto de legado digital para que ele possa ler tudo quando fizer 18 anos
  O texto relacionado está aqui
- Tenho curiosidade sobre o custo de produzir o livro. Fazer por conta própria sai barato, mas hoje em dia me falta tempo
- Também queria tentar. Você poderia compartilhar templates ou dicas?
- Ouvi dizer que cartão SD não dura muito. Que tal transformar parte dos vídeos em um flipbook?
Eu gosto de pesquisar árvore genealógica. Já rastreei ancestrais que chegaram à Argentina até 10 gerações atrás (cerca de 250 anos)
Do lado europeu, há muitas dificuldades por causa de guerras e perda de documentos
Mais recentemente, estou reunindo histórias antigas dos parentes mais velhos por mensagens de voz e organizando tudo
Acho que seria bom juntar isso em formato de wiki com a árvore genealógica que meu pai fez
- Dez gerações é impressionante. Fiquei curioso sobre de que países vieram seus ancestrais
Todo ano minha esposa seleciona as fotos da nossa conta compartilhada e transforma em um livro de 50 páginas
Já temos 12 anos de registros anuais, que viraram memórias que podemos folhear com as mãos
Ela também faz esse trabalho para outras pessoas, e recebe uma ótima resposta por causa desse toque pessoal
O projeto em si é ótimo, mas a privacidade importa quando se usa API de LLM
Eu não gostaria de entregar minhas fotos a modelos de empresas americanas
- Há alternativas como confer.to
- Mais do que fotos, o que me preocupa são os extratos bancários
- O autor já publicou as fotos no blog, então aparentemente não as considera secretas
- Talvez existam alternativas como PPQ.AI, OpenRouter.AI ou Apple on-device AI
- Nesse caso, você confiaria seus dados a LLMs de empresas chinesas, russas ou europeias?
A combinação de entrevistas familiares com um workflow de LLM é realmente um ótimo caso de uso
Mas exportar até histórico de localização do Google Maps, Uber, transações bancárias e Shazam parece passar do limite
Hoje há muitos projetos de IA dizendo “os dados ficam no meu dispositivo”, mas na prática o caminho que os dados percorrem não é claro
Acho que os usuários não entendem suficientemente esse trade-off
Mesmo que se diga “privado por padrão”, na prática os dados são enviados para os servidores da empresa de IA
Se LLM local não é suportado, a mensagem sobre privacidade deveria ser mais clara
Fiquei desconfortável com a parte em que dados de Google Maps, Uber, banco e Shazam foram entregues à IA
O projeto em si é excelente, mas confiar a um serviço os dados mais sensíveis é arriscado
A possibilidade de vazamento sempre existe algum dia
- Eu não fico desconfortável. Só não tenho interesse nesse tipo de obsessão com os próprios dados (quantified self)
  Tenho interesse em preservar histórias de família, mas não em autoanálise
A ideia é boa, mas a questão é até onde compartilhar
Quando é só para você, dá para registrar tudo, mas quando a família inteira vai ver, surgem histórias sensíveis
- Concordo. Além disso, tudo isso vai para os servidores da Anthropic
  Registrar até o passado sombrio ou conflitos da família pode ser uma invasão de privacidade
  Guerra, prisão, herança e coisas assim carregam memórias e emoções diferentes para cada pessoa
  Se a IA costura tudo isso, sobra apenas uma ilusão de objetividade, e ela ainda pode reabrir feridas dentro da família
  No fim, acho que as memórias deveriam mesmo ter um ciclo de vida natural de esquecimento
  Pessoas muito imersas em tecnologia muitas vezes ignoram essa complexidade humana
- No fim das contas, é minha wiki, então posso fazer do jeito que eu quiser

Enciclopédia pessoal

O início do projeto de enciclopédia pessoal

Reconstituição da memória com software de wiki

Combinação de dados digitais com modelos de linguagem

Experimentos de integração de dados compostos

Enciclopedização de dados pessoais

Divulgação do projeto whoami.wiki

Leituras relacionadas

1 comentários

Comentários do Hacker News