Code Alpaca - LLaMA treinado com instruções de geração de código

xguru · 2023-03-27T11:55:57+09:00

Modelo ajustado com base no Stanford Alpaca 7B/13B para ser mais adequado ao uso por desenvolvedores em tarefas de programação Substituição por um conjunto de 20K de dados de instruction following relacionados à geração de código (usando a técnica Self-Instruct) Modificação parcial do pipeline de geração de dados: os prompts foram alterados para se relacionarem à geração/edição/otimização de código, em vez de tarefas gerais Ajuste fino com código de treinamento do Hugging Face e Deepspeed

(github.com/sahil280114)

21 pontos por xguru 2023-03-27 | Ainda não há comentários. | Compartilhar no WhatsApp

Modelo ajustado com base no Stanford Alpaca 7B/13B para ser mais adequado ao uso por desenvolvedores em tarefas de programação
Substituição por um conjunto de 20K de dados de instruction following relacionados à geração de código (usando a técnica Self-Instruct)
Modificação parcial do pipeline de geração de dados: os prompts foram alterados para se relacionarem à geração/edição/otimização de código, em vez de tarefas gerais
Ajuste fino com código de treinamento do Hugging Face e Deepspeed

Code Alpaca - LLaMA treinado com instruções de geração de código

Leituras relacionadas

Ainda não há comentários.