- Ao organizar 1.351 fotos de família encontradas na casa da avó, foi criada uma wiki pessoal baseada em MediaWiki para estruturar memórias
- Ao conectar fotos, pessoas e acontecimentos em formato de wiki, a história da família e a história pessoal foram reconstruídas em forma de artigos
- Depois, vários rastros digitais, como Google Photos, histórico de localização, transações financeiras e dados de reconhecimento musical, foram integrados para testar a geração automática de páginas com Claude Code e modelos de linguagem
- Nesse processo, o modelo reconstituiu lacunas da memória e reorganizou os fluxos de conversas, viagens e amizades em narrativas baseadas em dados
- Como resultado, isso evoluiu para o projeto open source whoami.wiki, propondo um sistema em que cada pessoa pode explorar e possuir seus próprios dados como uma enciclopédia
O início do projeto de enciclopédia pessoal
- Na primeira visita à casa da avó após a pandemia, foram encontradas e organizadas 1.351 fotos antigas
- As fotos iam da juventude dos avós até os anos de ensino fundamental II do próprio autor
- A classificação inicial foi feita com base em atributos físicos, como tipo de filme e proporção das fotos
- Ao organizar as fotos, surgiram fragmentos de memórias, mas a ordem e o contexto não estavam claros
- Como eram fotos de uma época sem metadados EXIF, era difícil determinar a ordem cronológica
- Reorganizando as fotos junto com a avó, foram registrados em relato oral as memórias da época do casamento
- Foram anotados nomes de pessoas e acontecimentos, e algumas pessoas foram identificadas como parentes na juventude
- As anotações foram organizadas e o MediaWiki foi executado localmente, com edição no formato real da Wikipédia
- Foram criadas páginas estruturadas com infobox, texto principal, legendas de fotos e links para pessoas
- Elementos relacionados, como reformas legais, cerimônias e lugares, foram ligados a páginas reais da Wikipédia
Reconstituição da memória com software de wiki
- Em apenas dois dias, o contexto histórico das fotos foi organizado em artigos completos
- Isso mostrou na prática que o software de wiki é uma ferramenta poderosa para preservar conhecimento e mídia
- Nos meses seguintes, o trabalho foi expandido para transformar todo o acervo de fotos de família em páginas de wiki
- Com conselhos da comunidade r/genealogy, o método de registro de história oral foi aprimorado
- A eficiência da edição aumentou com transcrição de voz e modelos de linguagem
- Graças ao formato wiki, ficou fácil entender as conexões entre acontecimentos e pessoas
- Por exemplo, descobriu-se que a cantora do casamento dos avós era a enfermeira que realizou o parto do autor
Combinação de dados digitais com modelos de linguagem
- Depois, o projeto foi expandido para as fotos digitais do Google Photos
- Com metadados EXIF, foi possível usar data, hora e informações de localização
- Para 625 fotos de uma viagem em família de 2012, foi pedido ao Claude Code que gerasse páginas de wiki
- A exploração das imagens foi feita com referência a contact sheets criadas com ImageMagick
- O modelo reconstituiu lugares e atividades apenas com informações visuais e timestamps
- Incluindo descrições detalhadas de meios de transporte, locais visitados e identificação de pessoas
- Às versões iniciais geradas, foi adicionada uma lista de episódios pessoais para completar a narrativa
Experimentos de integração de dados compostos
- Depois, isso foi ampliado para os dados de uma viagem à Cidade do México em 2022
- Foram integradas 291 fotos, 343 vídeos, além de histórico de localização do Google Maps, corridas de Uber, transações bancárias e registros do Shazam
- Principais tarefas realizadas pelo Claude Code
- Analisar em conjunto transações bancárias e dados de localização para identificar os restaurantes visitados
- Usar registros de pagamento de ingressos para identificar os times e o nome do campeonato de uma partida de futebol
- Usar o histórico de corridas do Uber para determinar horários e locais de deslocamento
- Usar registros do Shazam para descrever os gêneros musicais de cada lugar
- Encontrar, em quadros de vídeo, uma cena de violão durante o jantar e inseri-la na página
- Foram aproveitados integralmente os recursos de páginas de discussão, categorias e histórico de edições do MediaWiki
- Sempre que novos dados eram adicionados, o histórico de revisões se acumulava como se houvesse um editor de wiki real
Enciclopedização de dados pessoais
- Com o tempo, o modelo passou a preencher lacunas da memória
- Ao cruzar várias fontes de dados, o modelo restaurava fatos que já haviam sido esquecidos
- Foram analisados cerca de 100 mil mensagens e notas de voz de arquivos do Facebook, Instagram e WhatsApp
- Das conversas com amigos, foram extraídos os fluxos das amizades e acontecimentos da vida, transformados em páginas
- Os amigos liam essas páginas e se envolviam a ponto de ler tudo com atenção
- Com isso, o projeto deixou de ser apenas uma história familiar e evoluiu para a construção de uma enciclopédia pessoal (personal encyclopedia)
- Foi concluído um sistema estruturado e interligado de registro pessoal baseado em dados
Divulgação do projeto whoami.wiki
- Com base nessa experiência, whoami.wiki foi publicado como open source
- Baseado em MediaWiki, gera automaticamente páginas de wiki a partir de dados pessoais
- O usuário fornece a exportação dos próprios dados, e o modelo de linguagem escreve o rascunho inicial
- Execução local, preservação da propriedade dos dados e independência de modelo garantidas
- Qualquer tema pessoal — casamento, amigos, viagens — pode ser registrado no mesmo formato de uma wiki pública
- A experiência de explorar as páginas prontas oferece uma diversão que lembra a timeline inicial do Facebook
- Mais importante do que a tecnologia é a redescoberta das pessoas e das memórias
- Ao registrar a vida da avó, houve uma nova percepção de sua força e resiliência
- Ao revisitar as relações com amigos, foram recuperados gratidão e senso de conexão
- O projeto ainda está em estágio inicial, e qualquer pessoa pode começar diretamente pela documentação de instalação
- Os dados continuam pertencendo ao usuário e ficam em uma estrutura legível por qualquer modelo
- O projeto segue sendo melhorado continuamente com feedback de colaboradores
1 comentários
Comentários do Hacker News
Acho este projeto realmente incrível e uma forma interessante de preservar a história da família
Mas a parte em que a IA entra me deixou com sentimentos complexos
Houve um certo amargor, como se o trabalho artesanal estivesse sendo empurrado para fora pela fábrica, e ao mesmo tempo ver a IA cruzando extratos bancários, ingressos e até histórico de músicas pareceu um pouco distópico
Ainda assim, no geral, foi uma tentativa extremamente impressionante
No começo, eu mesmo fazia toda a edição e montava o material como um historiador
Depois, quando comecei os experimentos com agentes, o ritmo de trabalho acelerou muito, mas ainda assim passei muito tempo como um “colaborador de wiki”, pensando no que manter e no que apagar
Ao mesmo tempo, essa experiência me fez perceber de forma muito concreta a importância de proteger os dados pessoais. Estamos deixando rastros digitais demais
Como a “bicicleta para a mente” de que Steve Jobs falava, a tecnologia funcionou como uma ferramenta para ajudar o trabalho humano
Fazia tempo que eu não via a tecnologia ajudando uma criação humana de um jeito tão humano, e isso me trouxe de volta aquela empolgação de antigamente
Não vejo problema moral em um LLM organizar informações, mas me incomoda que um modelo de uma grande empresa fale no lugar da narrativa pessoal de alguém
O autor ficou com as partes interessantes, e a IA com o trabalho chato de conectar os dados; acho ideal essa divisão de papéis
Minha esposa e eu, todo Ano-Novo, juntamos umas 50 folhas de papel e fazemos um pequeno caderno
Encadernamos com retalhos de roupa gasta e decoramos com objetos de lembrança, como caixinhas de fósforo de viagens
Ao longo do ano, escrevemos o que aprendemos, brigas e reconciliações, receitas, pensamentos etc., deixando aquilo como um registro daquele ano
O motivo de fazermos isso à mão em vez de usar ferramentas de IA é que o processo é um ritual significativo e prazeroso
Fica ainda mais bonito pensando que nossos filhos vão ler isso no futuro
Como aqueles antigos livros de receita marcados pelo uso, um livro com respingos de tinta tem muito mais charme
Eu também comecei um projeto assim em um livro impresso de verdade
Estou diagramando milhares de fotos no Scribus e montando livros por ano
Gosto da ideia de que, mesmo depois que eu morrer, meus rastros continuem existindo fisicamente
Pretendo prender um cartão SD na folha de rosto para deixar vídeos junto
Além disso, consegui uma impressora Canon Selphy usada e imprimo fotos em casa. As cores não são perfeitas, mas dá uma satisfação vê-las penduradas na parede
Um grampeador 360 graus é o melhor para encadernação rápida
É um projeto de legado digital para que ele possa ler tudo quando fizer 18 anos
O texto relacionado está aqui
Eu gosto de pesquisar árvore genealógica. Já rastreei ancestrais que chegaram à Argentina até 10 gerações atrás (cerca de 250 anos)
Do lado europeu, há muitas dificuldades por causa de guerras e perda de documentos
Mais recentemente, estou reunindo histórias antigas dos parentes mais velhos por mensagens de voz e organizando tudo
Acho que seria bom juntar isso em formato de wiki com a árvore genealógica que meu pai fez
Todo ano minha esposa seleciona as fotos da nossa conta compartilhada e transforma em um livro de 50 páginas
Já temos 12 anos de registros anuais, que viraram memórias que podemos folhear com as mãos
Ela também faz esse trabalho para outras pessoas, e recebe uma ótima resposta por causa desse toque pessoal
O projeto em si é ótimo, mas a privacidade importa quando se usa API de LLM
Eu não gostaria de entregar minhas fotos a modelos de empresas americanas
A combinação de entrevistas familiares com um workflow de LLM é realmente um ótimo caso de uso
Mas exportar até histórico de localização do Google Maps, Uber, transações bancárias e Shazam parece passar do limite
Hoje há muitos projetos de IA dizendo “os dados ficam no meu dispositivo”, mas na prática o caminho que os dados percorrem não é claro
Acho que os usuários não entendem suficientemente esse trade-off
Mesmo que se diga “privado por padrão”, na prática os dados são enviados para os servidores da empresa de IA
Se LLM local não é suportado, a mensagem sobre privacidade deveria ser mais clara
Fiquei desconfortável com a parte em que dados de Google Maps, Uber, banco e Shazam foram entregues à IA
O projeto em si é excelente, mas confiar a um serviço os dados mais sensíveis é arriscado
A possibilidade de vazamento sempre existe algum dia
Tenho interesse em preservar histórias de família, mas não em autoanálise
A ideia é boa, mas a questão é até onde compartilhar
Quando é só para você, dá para registrar tudo, mas quando a família inteira vai ver, surgem histórias sensíveis
Registrar até o passado sombrio ou conflitos da família pode ser uma invasão de privacidade
Guerra, prisão, herança e coisas assim carregam memórias e emoções diferentes para cada pessoa
Se a IA costura tudo isso, sobra apenas uma ilusão de objetividade, e ela ainda pode reabrir feridas dentro da família
No fim, acho que as memórias deveriam mesmo ter um ciclo de vida natural de esquecimento
Pessoas muito imersas em tecnologia muitas vezes ignoram essa complexidade humana