NVBeacon - um app para ver o status de GPUs NVIDIA remotas na barra de menus do macOS
(github.com/jaein4722)Como trabalho com pesquisa em IA, frequentemente rodo treinamentos em servidores de GPU compartilhados. Nesses momentos, era bem incômodo ter que abrir o terminal toda vez para checar o nvidia-smi e ver se havia alguma GPU livre, se o processo de treinamento ainda estava vivo e se util e memória estavam sendo usados corretamente.
Então resolvi criar um app que permite ver diretamente na barra de menus do macOS o status de servidores remotos com GPUs NVIDIA. Ele se conecta ao servidor via SSH para buscar as informações e foi feito para funcionar sem exigir a instalação de agentes separados ou programas adicionais no servidor.
Na barra de menus, dá para ver imediatamente o estado das GPUs do servidor conectado e também consultar informações por processo. Ele também obtém o UID dos processos, algo que não é fácil de visualizar de imediato apenas com o nvidia-smi, permitindo identificar de forma mais intuitiva qual usuário está executando qual tarefa. Tentei aproveitar ao máximo as configurações de SSH já existentes e também dei atenção à parte de encontrar rapidamente os processos que eu mesmo estou executando.
É uma ferramenta que fiz para uso pessoal, mas depois de pedir para algumas pessoas próximas testarem de forma simples, a reação foi melhor do que eu esperava, então resolvi publicá-la. No momento, é exclusiva para macOS.
Se houver alguém que use com frequência servidores de GPU em um ambiente parecido, ficarei grato se puder experimentar e enviar feedback sobre pontos incômodos ou funcionalidades necessárias!
2 comentários
Uau... isso vai ser muito útil mesmo
Obrigado!
Continuamos melhorando para que seja cada vez mais confortável de usar.