19 pontos por xguru 2022-11-17 | 3 comentários | Compartilhar no WhatsApp
  • O que aconteceria se o celular gravasse tudo o que falamos o tempo todo e processasse isso com IA? Eu testei primeiro
  • Gravação constante durante todo o tempo em que estou acordado, exceto quando durmo (e às vezes desligo em situações inadequadas). É um PoC e ainda é difícil aplicar isso na prática
  • A motivação para criar isso foi o lançamento do Whisper da OpenAI

Como funciona

  • Dois microfones gravam tudo o que é dito ao longo do dia e, no fim do dia, o Whisper processa e converte em texto
  • Com isso, percebi que dá para criar um assistente digital básico no estilo "Ok Google"
  • Há dois tipos de informação que podem ser extraídos diariamente
    • Active: coisas que eu instruo conscientemente ao assistente
    • Passive: todas as demais informações que deveriam ser extraídas sem que eu precise fazer nenhuma ação

Funções ativas

  • As coisas que devem ser processadas de forma assíncrona toda noite são ditas no formato 'KEYWORD COMMAND data END KEYWORD'
    • 'Robert WEIGHT 60.1 end Robert': Robert é o nome do assistente, e end é a palavra-chave de encerramento
    • Motivo para não usar "OK Google": é limitado, não gosto que as informações vão para o Google e funciona de forma síncrona, processando imediatamente ao falar
    • Claro, como o processamento é assíncrono, há a desvantagem de não saber o resultado antes do fim do dia

Vendo os resultados

  • Subo na balança e depois digo 'Robert WEIGHT 62.8 end Robert'
  • Ao acordar, leio o rastreador de sono (Mi Band): 'Robert SLEEP 7 hours 14 minutes end Robert'
    • Os aparelhos eletrônicos até enviam essas informações ao celular, mas como não há como extraí-las, usei o assistente digital como uma espécie de API analógica
  • Depois de comer, digo 'Robert LUNCH two toasts with a fried egg end Robert'
    • Para os alimentos consumidos a cada dia, calculo as calorias com uma API externa
  • Depois de ouvir um podcast, digo 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
    • Salva todas as anotações e ideias
  • Depois de abastecer, digo 'Robert SPENT 250,000 on fuel end Robert'
    • Salva diariamente os gastos que tive
  • Falar assim comigo mesmo é meio estranho, mas a vantagem é não precisar pegar o celular para fazer algo

Painel de controle

  • Criei um dashboard para visualizar todas as informações inseridas dessa forma
  • Também criei o My Journal, que registra automaticamente o que fiz ao longo do dia

Informações passivas - ainda em andamento

  • RELATIONSHIP THERMOMETER: termômetro de relacionamentos
  • SENTIMENT ANALYSIS: análise de sentimento
  • TOTAL RECALL: pesquisar tudo o que foi dito sobre um tópico específico e buscar o que eu pensava sobre esse tópico em um momento específico

Conclusão preliminar

  • Áudio + contexto são necessários
  • O potencial obtido com isso é enorme, tanto para o bem quanto para o mal
    • Positivo: memória perfeita, psicólogo/coach pessoal, meu clone virtual
    • Negativo: tudo isso estar nas mãos de outra pessoa
  • A diferença entre utopia e distopia é quem pode acessar essas informações

3 comentários

 
budlebee 2022-11-17

“A diferença entre utopia e distopia é quem pode acessar essa informação.” Belo pensamento.

 
nicewook 2022-11-17

É atraente. Parece plenamente viável de se tornar realidade.
Como em um vlog, também seria possível criar conteúdo para compartilhar e dividir, às vezes, uma rotina exemplar.

 
xguru 2022-11-17

O autor postou isso diretamente no HN e também respondeu aos comentários: https://news.ycombinator.com/item?id=33608437
Também inclui o link do AliExpress para o microfone usado rs

Whisper - sistema multilíngue de reconhecimento de fala (ASR) que a OpenAI lançou como open source