16 pontos por xguru 2023-05-01 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Vicuna v0 13B com ajuste fino por instruções e treinamento com RLHF
  • SFT (Supervised Fine-Tuning) usando 3 conjuntos de dados
    • OpenAssistant Conversations Dataset (OASST1)
    • GPT4All Prompt Generations
    • Alpaca
  • Disponível para download no HuggingFace como delta de pesos para o modelo LLaMA (dados originais do LLaMA necessários)

Ainda não há comentários.

Ainda não há comentários.