DeepSpeed Chat - Framework para treinar modelos tipo ChatGPT usando RLHF
(github.com/microsoft)- Framework de sistema aberto rápido, barato e escalável
- Permite criar modelos de alta qualidade no estilo ChatGPT em qualquer escala por meio de RLHF (Reinforcement Learning from Human Feedback) de ponta a ponta
- Com 1 clique, é possível treinar, gerar e servir um modelo ChatGPT de 1,3B de parâmetros em até 1,36 hora usando uma única GPU NVIDIA A6000 com 48GB de memória
- Já é usado por Databricks Dolly, CarperAI-TRLX e Huggingface-PEFT
1 comentários
DeepSpeed - biblioteca de otimização de deep learning divulgada pela MS
Databricks divulga como open source o Dolly 2.0, semelhante ao ChatGPT