Ollama agora oferece suporte a placas de vídeo AMD

(ollama.com)

3 pontos por GN⁺ 2024-03-16 | 1 comentários | Compartilhar no WhatsApp

O Ollama começou a oferecer suporte a placas de vídeo AMD em versão prévia no Windows e no Linux
Todos os recursos do Ollama agora podem ser acelerados por placas de vídeo AMD no Linux e no Windows

Placas de vídeo compatíveis

Série AMD Radeon RX: 7900 XTX, 7900 XT, 7900, 7800 XT, 7700 XT, 7600 XT, 7600, 6950 XT, 6900 XTX, 6900XT, 6800 XT, 6800, Vega 64, Vega 56
Série AMD Radeon PRO: W7900, W7800, W7700, W7600, W7500, W6900X, W6800X Duo, W6800X, W6800, V620, V420, V340, V320, Vega II Duo, Vega II, VII SSG
Série AMD Instinct: MI300X, MI300A, MI300, MI250X, MI250, MI210, MI200, MI100, MI60, MI50
O suporte para mais placas de vídeo AMD será disponibilizado em breve.

1 comentários

GN⁺ 2024-03-16

Comentários no Hacker News

Falta de reconhecimento pelas contribuições do llama.cpp
- Chama a atenção que o llama.cpp não receba reconhecimento direto nem agradecimento por ferramentas baseadas na tecnologia que ele fornece.
- Outros softwares de "execução local" recebem um nível adequado de crédito, e embora o Ollama pareça não ter problemas com a licença MIT, não há nenhum agradecimento no repositório, no blog nem no site do Ollama.
Opiniões sobre o post do blog relacionado ao suporte a AMD no Ollama
- O post do blog parece curioso. Já estava usando o Ollama em uma AMD RX 6650 havia algumas semanas.
- Eles já ofereciam um contêiner ROCm desde 21 dias atrás, e parece que isso foi publicado junto com a versão mais recente, 0.1.29. Fica a dúvida sobre o que realmente mudou nesta release em relação ao suporte a AMD.
- Há uma issue mostrando o processo de rodar o Ollama em placas AMD sem suporte oficial. No fim, basta definir variáveis de ambiente.
- Foi encontrada a mudança de que o modelo starcoder2 agora funciona. Antes, ele travava.
Dúvidas sobre a atenção excessiva ao Ollama
- Não está claro por que o Ollama recebe tanta atenção. Ele só suporta um modelo por vez e tem valor limitado para uso apenas experimental.
- Ele torna o processo de experimentação muito fácil, mas, considerando que depende totalmente do llama.cpp e que sua principal proposta de valor é o gerenciamento simples de modelos, parece supervalorizado em comparação com a atenção e os elogios que recebe.
- Depois dos testes iniciais, no fim é preciso implantar o modelo em produção. O ponto não é deixar de dar crédito ao llama.cpp, mas sim que este produto recebe atenção demais em relação ao valor que entrega.
Agradecimento pelo suporte a RX 6800/6800 XT / 6900 XT
- É bom poder usar em tarefas de ML uma placa comprada por um valor exagerado por causa da escassez pós-COVID.
- Agradecimentos ao projeto Ollama e ao llama.cpp.
Mensagem de aviso relacionada à AMD ao executar o Ollama
- O fooocus funciona, mas ao rodar o Ollama aparece uma mensagem de aviso relacionada ao driver AMD no Linux.
- Como não há biblioteca ROCm, ele acaba usando a CPU.
- É preciso verificar como reinstalar o ROCm no Arch Linux.
Reação positiva à perda de competitividade do CUDA
- Quanto mais projetos como este surgirem, menos importante o CUDA se torna, e menor fica a vantagem competitiva da Nvidia.
Softwares de LLM local incentivam a compra de novo hardware
- Placas antigas como RX 570/580 não são suportadas, e embora o hardware novo seja mais poderoso, como o CUDA foi lançado em 2007 e o ROCm em 2016, parece que não deveria ser necessário ter placas tão recentes.
Experiência de uso simples do Ollama
- Não havia experiência anterior rodando modelos locais, mas no Ubuntu 22 funcionou de imediato com uma placa 7600, o que é excelente.
Curiosidade sobre o uso de OpenCL
- Como o OpenCL é usado com bem menos frequência do que o Cuda, fica a curiosidade sobre como isso foi implementado com sucesso.
- Foi pago um valor considerável por uma placa 4090, mas seria bom ter opção de escolha.
Preço das placas NVidia e esforços para melhorar o suporte à AMD
- Diante do preço muito alto e da dificuldade de encontrar placas NVidia topo de linha, isso sugere que há muito esforço sendo feito para melhorar o suporte à AMD.

Ollama agora oferece suporte a placas de vídeo AMD

Placas de vídeo compatíveis

Leituras relacionadas

1 comentários

Comentários no Hacker News