- A OpenAI anunciou o ajuste fino e atualizações da API para o GPT-3.5 Turbo, permitindo que desenvolvedores personalizem o modelo para casos de uso específicos.
- Espera-se que o ajuste fino para o GPT-4 esteja disponível no outono.
- Em testes iniciais, o GPT-3.5 Turbo ajustado mostrou que pode superar ou igualar o desempenho do GPT-4 base em tarefas específicas.
- Os dados enviados pela API de ajuste fino pertencem ao cliente e não são usados pela OpenAI nem por outras organizações para treinar outros modelos.
- O ajuste fino tem sido usado para melhorar o desempenho do modelo em casos de uso comuns, como melhor capacidade de controle, formatos de saída confiáveis e tom personalizado.
- O ajuste fino permite que empresas encurtem prompts enquanto mantêm desempenho semelhante e processem 4k tokens, o dobro dos modelos anteriormente ajustados.
- O ajuste fino é mais eficaz quando combinado com técnicas como engenharia de prompts, recuperação de informação e chamada de funções.
- O custo do ajuste fino é dividido em dois tipos: custo de treinamento inicial e custo de uso.
- A OpenAI também oferece
babbage-002 e davinci-002 como substitutos dos modelos base originais do GPT-3, e eles podem ser ajustados por meio de novos endpoints da API.
- O endpoint
/v1/fine-tunes existente será descontinuado em 4 de janeiro de 2024.
- A OpenAI está trabalhando para garantir a segurança das implantações de ajuste fino, e os dados de treinamento de ajuste fino são analisados por sua Moderation API e por um sistema de moderação baseado em GPT-4 para detectar dados de treinamento inseguros.
- Em um futuro próximo, será lançada uma UI de ajuste fino, permitindo que desenvolvedores acessem com mais facilidade informações sobre trabalhos de ajuste fino em andamento e snapshots de modelos concluídos.
1 comentários
Comentários do Hacker News