LM Studio - ferramenta que facilita a execução de LLMs localmente

(lmstudio.ai)

11 pontos por GN⁺ 2023-11-23 | 1 comentários | Compartilhar no WhatsApp

Permite encontrar, baixar e executar LLMs offline localmente
- Modelos como LLaMa, Falcon, MPT, StarCoder e GPT-Neo-X
macOS / Windows / Linux (beta)
É possível usar os modelos por meio da interface de chat integrada ou de um servidor local compatível com OpenAI
Suporta modelos Llama, MPT e StarCoder baseados em ggml do HuggingFace
- (ex.: Llama 2, Orca, Vicuna, Nous Hermes, WizardCoder, MPT etc.).
Especificações mínimas e requisitos
- Apple Silicon Mac (M1/M2/M3) com macOS 13.6 ou superior
- PC com Windows / Linux (processador com suporte a AVX2)
- Recomenda-se 16 GB+ de RAM. Em PCs, recomenda-se 6 GB+ de VRAM
- Suporte a GPUs NVIDIA/AMD

Privacidade e uso do LM Studio

O LM Studio não coleta nem monitora os dados do usuário, e todos os dados permanecem localmente no dispositivo do usuário
É gratuito para uso pessoal; para uso profissional, é necessário entrar em contato com a equipe

Opinião do GN⁺

O LM Studio é uma solução atraente para usuários que valorizam a privacidade, e sua capacidade de executar LLMs offline é o ponto mais importante.
É interessante o fato de os dados do usuário ficarem armazenados apenas localmente, além do suporte a diversos modelos, e o fato de ser gratuito para usuários individuais é uma vantagem.
Os requisitos de hardware são relativamente altos, tornando-o mais adequado para usuários com dispositivos mais recentes, e o planejamento para uso profissional é um ponto positivo.

1 comentários

GN⁺ 2023-11-23

Comentários do Hacker News

Compartilhamento de um link mostrando que é possível fazer o mesmo trabalho com código aberto usando Ollama e uma UI.
Avaliação positiva do LM Studio e de seus recursos:
- runtime local de modelos
- catálogo de modelos
- UI para conversar facilmente com os modelos
- API compatível com OpenAI
- inclui plugins como RAG (usando ChromaDB)
- está bem posicionado para aproveitar novos recursos do ecossistema de sistemas operacionais
- infelizmente, o próprio LM Studio não é open source
Interesse em testar modelos sem censura. Encontrou o modelo "TheBloke/Luna-AI-Llama2-Uncensored-GGML" e baixou apenas o primeiro arquivo para verificar se funcionava. Quer saber se também é preciso baixar os demais arquivos e se o modelo realmente não é censurado em perguntas sensíveis específicas.
Pergunta de iniciante sobre LLMs: o que acontece se a série "O Senhor dos Anéis" for inserida em um LLM, se existe um LLM básico e "ignorante", e se isso permitiria criar um especialista na Terra-média.
Requisitos curiosos para uma função avançada de engenharia: exigem entendimento profundo de computadores e software, capacidade de elaborar algoritmos e escrever programas, entre outros, mas é difícil levar essas exigências muito a sério.
Compartilhamento de um link para uma UI simples criada pessoalmente como tentativa de simplificar configurações complexas.
Curiosidade sobre o público potencial de softwares de LLM e vontade de ver informações ou especulações sobre segmentação de mercado. Apesar da configuração complexa, vê valor nessa interface para conversar e gerenciar modelos.
Sugestões de melhoria para a UI do aplicativo:
- o estado padrão do campo da caixa de chat precisa melhorar
- não está claro como configurar aceleração CUDA antes de carregar o modelo
- alguns modelos do HuggingFace não são listados e o motivo não é informado
- a parte em acordeão da interface só responde à roda do mouse para rolagem
- a aba de servidor é muito útil para depuração inicial
Perguntas sobre problemas que podem surgir ao usar vários modelos de LLM (Mistral, Llama 2, Code Llama, Orca Mini, Vicuna), como 50% de alucinação, recomendação de código de API inexistente e reprodução de respostas desatualizadas do StackOverflow, além de pedido para compartilharem casos de uso reais desses modelos.
Após instalar e executar o LM Studio, houve aumento do uso de CPU para até 30% e mais ruído da ventoinha do notebook. Depois de encerrar o processo do LM Studio e abri-lo novamente, o uso em segundo plano caiu para 5%.

LM Studio - ferramenta que facilita a execução de LLMs localmente

Privacidade e uso do LM Studio

Opinião do GN⁺

Leituras relacionadas

1 comentários

Comentários do Hacker News