LLaMA-Adapter V2: ferramenta para fazer fine-tuning eficiente do LLaMA

xguru · 2023-05-03T10:18:01+09:00

Com apenas 1,2 milhão de parâmetros treináveis, é possível treinar o LLaMA em apenas 1 hora como um modelo de instruction-following e multimodal O Alpaca precisa de 7B de parâmetros, 13 GB de armazenamento e 3 horas, enquanto o LLaMA-Adapter precisa de 1,2M de parâmetros, 4,7 MB de armazenamento e 1 hora

(github.com/ZrrSkywalker)

7 pontos por xguru 2023-05-03 | 1 comentários | Compartilhar no WhatsApp

Com apenas 1,2 milhão de parâmetros treináveis, é possível treinar o LLaMA em apenas 1 hora como um modelo de instruction-following e multimodal
O Alpaca precisa de 7B de parâmetros, 13 GB de armazenamento e 3 horas, enquanto o
LLaMA-Adapter precisa de 1,2M de parâmetros, 4,7 MB de armazenamento e 1 hora

1 comentários

bytebrawlers 2023-05-03

Não é que o principal ponto seja o fato de ele usar um método de PEFT semelhante ao LoRA e, acima de tudo, oferecer suporte a contexto visual? Já existem tantas abordagens de SFT (Instruction Fine-Tuning) com PEFT para o LLaMA que...

LLaMA-Adapter V2: ferramenta para fazer fine-tuning eficiente do LLaMA

Leituras relacionadas

1 comentários