7 pontos por xguru 2023-05-03 | 1 comentários | Compartilhar no WhatsApp
  • Com apenas 1,2 milhão de parâmetros treináveis, é possível treinar o LLaMA em apenas 1 hora como um modelo de instruction-following e multimodal
  • O Alpaca precisa de 7B de parâmetros, 13 GB de armazenamento e 3 horas, enquanto o
    LLaMA-Adapter precisa de 1,2M de parâmetros, 4,7 MB de armazenamento e 1 hora

1 comentários

 
bytebrawlers 2023-05-03

Não é que o principal ponto seja o fato de ele usar um método de PEFT semelhante ao LoRA e, acima de tudo, oferecer suporte a contexto visual? Já existem tantas abordagens de SFT (Instruction Fine-Tuning) com PEFT para o LLaMA que...