21 pontos por xguru 2023-03-27 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Modelo ajustado com base no Stanford Alpaca 7B/13B para ser mais adequado ao uso por desenvolvedores em tarefas de programação
  • Substituição por um conjunto de 20K de dados de instruction following relacionados à geração de código (usando a técnica Self-Instruct)
  • Modificação parcial do pipeline de geração de dados: os prompts foram alterados para se relacionarem à geração/edição/otimização de código, em vez de tarefas gerais
  • Ajuste fino com código de treinamento do Hugging Face e Deepspeed

Ainda não há comentários.

Ainda não há comentários.