- O que aconteceria se o celular gravasse tudo o que falamos o tempo todo e processasse isso com IA? Eu testei primeiro
- Gravação constante durante todo o tempo em que estou acordado, exceto quando durmo (e às vezes desligo em situações inadequadas). É um PoC e ainda é difícil aplicar isso na prática
- A motivação para criar isso foi o lançamento do Whisper da OpenAI
Como funciona
- Dois microfones gravam tudo o que é dito ao longo do dia e, no fim do dia, o Whisper processa e converte em texto
- Com isso, percebi que dá para criar um assistente digital básico no estilo "Ok Google"
- Há dois tipos de informação que podem ser extraídos diariamente
- Active: coisas que eu instruo conscientemente ao assistente
- Passive: todas as demais informações que deveriam ser extraídas sem que eu precise fazer nenhuma ação
Funções ativas
- As coisas que devem ser processadas de forma assíncrona toda noite são ditas no formato
'KEYWORD COMMAND data END KEYWORD'
'Robert WEIGHT 60.1 end Robert': Robert é o nome do assistente, e end é a palavra-chave de encerramento
- Motivo para não usar "OK Google": é limitado, não gosto que as informações vão para o Google e funciona de forma síncrona, processando imediatamente ao falar
- Claro, como o processamento é assíncrono, há a desvantagem de não saber o resultado antes do fim do dia
Vendo os resultados
- Subo na balança e depois digo
'Robert WEIGHT 62.8 end Robert'
- Ao acordar, leio o rastreador de sono (Mi Band):
'Robert SLEEP 7 hours 14 minutes end Robert'
- Os aparelhos eletrônicos até enviam essas informações ao celular, mas como não há como extraí-las, usei o assistente digital como uma espécie de API analógica
- Depois de comer, digo
'Robert LUNCH two toasts with a fried egg end Robert'
- Para os alimentos consumidos a cada dia, calculo as calorias com uma API externa
- Depois de ouvir um podcast, digo
'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- Salva todas as anotações e ideias
- Depois de abastecer, digo
'Robert SPENT 250,000 on fuel end Robert'
- Salva diariamente os gastos que tive
- Falar assim comigo mesmo é meio estranho, mas a vantagem é não precisar pegar o celular para fazer algo
Painel de controle
- Criei um dashboard para visualizar todas as informações inseridas dessa forma
- Também criei o My Journal, que registra automaticamente o que fiz ao longo do dia
Informações passivas - ainda em andamento
- RELATIONSHIP THERMOMETER: termômetro de relacionamentos
- SENTIMENT ANALYSIS: análise de sentimento
- TOTAL RECALL: pesquisar tudo o que foi dito sobre um tópico específico e buscar o que eu pensava sobre esse tópico em um momento específico
Conclusão preliminar
- Áudio + contexto são necessários
- O potencial obtido com isso é enorme, tanto para o bem quanto para o mal
- Positivo: memória perfeita, psicólogo/coach pessoal, meu clone virtual
- Negativo: tudo isso estar nas mãos de outra pessoa
- A diferença entre utopia e distopia é quem pode acessar essas informações
3 comentários
“A diferença entre utopia e distopia é quem pode acessar essa informação.” Belo pensamento.
É atraente. Parece plenamente viável de se tornar realidade.
Como em um vlog, também seria possível criar conteúdo para compartilhar e dividir, às vezes, uma rotina exemplar.
O autor postou isso diretamente no HN e também respondeu aos comentários: https://news.ycombinator.com/item?id=33608437
Também inclui o link do AliExpress para o microfone usado rs
Whisper - sistema multilíngue de reconhecimento de fala (ASR) que a OpenAI lançou como open source