Guia de como executar o Llama 2 localmente
(replicate.com)- É possível executar o Llama 2 no seu próprio dispositivo sem conexão com a internet.
- Há três ferramentas open source para executar o Llama 2 localmente: Llama.cpp, Ollama e MLC LLM.
- Llama.cpp é um port do Llama em C/C++ com suporte para Mac, Windows e Linux.
- Ollama é um app para macOS que permite executar o Llama 2 por meio de uma interface de linha de comando.
- Com o MLC LLM, é possível executar o Llama 2 em celulares, incluindo iOS e Android.
- O Ollama recomenda no mínimo 8 GB de RAM para executar o modelo 3B, 16 GB para o modelo 7B e 32 GB para o modelo 13B.
- O MLC LLM oferece suporte às versões 7B, 13B e 70B do Llama 2, mas ainda está em beta para usuários de iPhone.
- É possível compartilhar criações e obter suporte na comunidade do Discord.
- A Replicate oferece opções para executar e fazer fine-tuning do Llama 2 na nuvem.
2 comentários
Estou rodando no Mac Studio M2 e funciona bem.
Comentários no Hacker News