- No HN, o interesse em ajuste fino de LLMs open source tem aumentado bastante (ex.: post da Anyscale)
- Compartilhamento de anos de experiência e insights sobre ajuste fino de modelos, além de código prático
- Disponibilização de um conjunto de notebooks cobrindo rotulagem de dados, ajuste fino, execução eficiente de inferência e avaliação de custo/desempenho
- Treinamento de um modelo 7B que alcança 95% de correspondência com os rótulos do GPT-4 no conjunto de teste
- O que é ajuste fino? Uma forma de prompting mais poderosa do que escrever instruções em texto
- Treinamento de um modelo existente com pares de entrada/saída de exemplo para treinar modelos ajustados finamente
- Vantagens e desvantagens de prompting e ajuste fino
- Grande vantagem do ajuste fino: ele é muito mais eficaz para orientar o comportamento do modelo, permitindo que até modelos bem menores deem conta do recado
- Um modelo Llama 7B ajustado finamente é 50 vezes mais barato por token do que o GPT-3.5 e oferece resultados iguais ou melhores em muitos casos de uso
- Exemplo: classificar 2M de receitas com GPT-4 custaria US$ 23 mil, mas o modelo ajustado por nós apresenta desempenho semelhante ao GPT-4 e custa apenas US$ 19 para rodar em todo o conjunto de dados
- Desenvolvimento de um produto open source chamado OpenPipe
- O produto OpenPipe ajuda engenheiros a adotar ajuste fino da forma mais simples possível
- O post atual tem como objetivo compartilhar o que foi aprendido sobre ajuste fino
1 comentários
Comentários do Hacker News