talk-llama - Conversando com a LLaMA no terminal
(github.com/ggerganov)- Demonstração do Whisper Medium (Whisper.cpp) + LLaMA v2 13B Q8_0 em um M2 Ultra
- Faz reconhecimento de voz com o Whisper, envia a pergunta para a LLaMA e reproduz a resposta usando a síntese de voz do MacOS com o comando
say - Suporta gerenciamento de sessão, permitindo conversas contínuas com base no conteúdo anterior
1 comentários
O 13B parece funcionar bem no Ultra. Fico curioso para saber como seria no M3 Max.