macOSPilot - CoPilot de voz + visão para macOS
(github.com/elfvingralf)- Assistente de IA com voz e visão, utilizável em todos os aplicativos do macOS
- Ao pressionar o atalho e fazer uma pergunta por voz, ele fornece uma resposta em voz com base no contexto atual
- Cria uma captura de tela da janela atual e a envia ao OpenAI GPT Vision
- A pergunta é transcrita usando a API OpenAI Whisper e enviada junto como texto
- A resposta em texto recebida é convertida em voz usando o OpenAI TTS e reproduzida
- Desenvolvido com NodeJS/Electron
- O atalho padrão é Cmd + Shift + '
1 comentários
Comentários do Hacker News
Pergunta se é melhor usar o termo "macOS" em vez de "OSX" no prompt, ou se isso não foi algo muito pensado na escolha inicial.
Sugere adicionar uma opção de texto em streaming em vez de TTS na resposta.
Menciona que escreveu um script semelhante para configuração no Linux.
Recomenda definir um limite de gastos ao usar a API da OpenAI.
Reação positiva ao projeto.
Pergunta se há planos de fazer o projeto funcionar com LLMs locais em vez de "open"AI.
Opina que gostaria de construir algo integrado ao próprio terminal.
Reação negativa à informação de que "macOSpilot usa NodeJS/Electron".
Compartilha a experiência de uso com a estação de trabalho de áudio digital Ableton Live.
Compartilha uma imaginação sobre produtividade enquanto espera o resultado do comando
ls.