LLaMA-Adapter V2: ferramenta para fazer fine-tuning eficiente do LLaMA
(github.com/ZrrSkywalker)- Com apenas 1,2 milhão de parâmetros treináveis, é possível treinar o LLaMA em apenas 1 hora como um modelo de instruction-following e multimodal
- O Alpaca precisa de 7B de parâmetros, 13 GB de armazenamento e 3 horas, enquanto o
LLaMA-Adapter precisa de 1,2M de parâmetros, 4,7 MB de armazenamento e 1 hora
1 comentários
Não é que o principal ponto seja o fato de ele usar um método de PEFT semelhante ao LoRA e, acima de tudo, oferecer suporte a contexto visual? Já existem tantas abordagens de SFT (Instruction Fine-Tuning) com PEFT para o LLaMA que...