Code Alpaca - LLaMA treinado com instruções de geração de código
(github.com/sahil280114)- Modelo ajustado com base no Stanford Alpaca 7B/13B para ser mais adequado ao uso por desenvolvedores em tarefas de programação
- Substituição por um conjunto de 20K de dados de instruction following relacionados à geração de código (usando a técnica Self-Instruct)
- Modificação parcial do pipeline de geração de dados: os prompts foram alterados para se relacionarem à geração/edição/otimização de código, em vez de tarefas gerais
- Ajuste fino com código de treinamento do Hugging Face e Deepspeed
Ainda não há comentários.