1 pontos por GN⁺ 2023-08-23 | 1 comentários | Compartilhar no WhatsApp
  • A OpenAI anunciou o ajuste fino e atualizações da API para o GPT-3.5 Turbo, permitindo que desenvolvedores personalizem o modelo para casos de uso específicos.
  • Espera-se que o ajuste fino para o GPT-4 esteja disponível no outono.
  • Em testes iniciais, o GPT-3.5 Turbo ajustado mostrou que pode superar ou igualar o desempenho do GPT-4 base em tarefas específicas.
  • Os dados enviados pela API de ajuste fino pertencem ao cliente e não são usados pela OpenAI nem por outras organizações para treinar outros modelos.
  • O ajuste fino tem sido usado para melhorar o desempenho do modelo em casos de uso comuns, como melhor capacidade de controle, formatos de saída confiáveis e tom personalizado.
  • O ajuste fino permite que empresas encurtem prompts enquanto mantêm desempenho semelhante e processem 4k tokens, o dobro dos modelos anteriormente ajustados.
  • O ajuste fino é mais eficaz quando combinado com técnicas como engenharia de prompts, recuperação de informação e chamada de funções.
  • O custo do ajuste fino é dividido em dois tipos: custo de treinamento inicial e custo de uso.
  • A OpenAI também oferece babbage-002 e davinci-002 como substitutos dos modelos base originais do GPT-3, e eles podem ser ajustados por meio de novos endpoints da API.
  • O endpoint /v1/fine-tunes existente será descontinuado em 4 de janeiro de 2024.
  • A OpenAI está trabalhando para garantir a segurança das implantações de ajuste fino, e os dados de treinamento de ajuste fino são analisados por sua Moderation API e por um sistema de moderação baseado em GPT-4 para detectar dados de treinamento inseguros.
  • Em um futuro próximo, será lançada uma UI de ajuste fino, permitindo que desenvolvedores acessem com mais facilidade informações sobre trabalhos de ajuste fino em andamento e snapshots de modelos concluídos.

1 comentários

 
GN⁺ 2023-08-23
Comentários do Hacker News
  • A OpenAI lançou o ajuste fino do GPT-3.5, como prometido, alguns meses após abrir o acesso à API do GPT-4.
  • Apesar das críticas de que não é aberta o suficiente, a OpenAI é reconhecida pela rápida inovação que a coloca à frente de outras IAs open source, como Llama e Bard.
  • O custo de geração com o GPT-3.5 Turbo ajustado é 8 vezes maior que o do modelo base, então ele só é economicamente vantajoso para quem consegue reduzir bastante o tamanho do prompt.
  • Foi pedida uma comparação entre o GPT-3.5 Turbo ajustado e o modelo Llama2, sendo que o segundo exige infraestrutura alugada.
  • Alguns usuários acham que o GPT-3.5 Turbo é repetitivo e impreciso, inadequado para escrita e programação, enquanto outros consideram o GPT-4 muito melhor e útil como ferramenta de apoio para educação ou resolução de problemas.
  • Um recurso desejado pelos usuários é um sistema nativo de divisão de prompts para eliminar a necessidade de ferramentas de terceiros.
  • Chamou atenção a decisão da OpenAI de não fornecer modelos "inseguros", e tanto o davinci-002 quanto o babbage-002 entram em loop infinito em conclusões "inseguras".
  • Os dados de treinamento para ajuste fino passam pela Moderation API da OpenAI e por um sistema de censura baseado em GPT-4, que se supõe ser usado apenas quando a "segurança" é ambígua por causa do alto custo.
  • Surgiram perguntas sobre como calcular a quantidade de tokens necessária para tarefas de ajuste fino e, em geral, de quantos dados de ajuste fino são necessários para influenciar de forma eficaz o comportamento do modelo base.
  • A possibilidade de ajustar modelos de "Chat" parece interessante, e foi levantada a questão de se modelos ajustados poderiam contornar os detectores de IA atuais.
  • Foram levantadas preocupações com privacidade, incluindo perguntas sobre por quanto tempo a OpenAI ou a Microsoft armazenam textos de chamadas de API.
  • No geral, o lançamento do ajuste fino para o GPT-3.5 Turbo é visto como um avanço positivo, e há expectativa pelo ajuste fino de 16k.