- Foi criado um app de exploração de carreira baseado em IA e, com o crescimento explosivo, o custo do GPT-4 começou a ultrapassar US$ 100 por dia
- Métodos usados para reduzir os custos de IA em até 99%, diminuindo a latência e mantendo a qualidade
- Primeiro, gerar resultados com o modelo mais poderoso (GPT-4) e depois usar esses resultados para fazer o fine-tuning de um modelo menor
- Armazenar as requisições/respostas de IA de forma que possam ser exportadas facilmente. Uso do Helicone AI. Basta substituir a API da OpenAI e as requisições de IA passam a ser salvas em uma tabela
- Depois de acumular cerca de 100 a 500 pares de requisição/resposta, exportar e refinar os dados para obter boa qualidade
- Com esse dataset, fazer o fine-tuning do Mixtral 8x7B usando serviços de hospedagem como Together/Anyscale
- Substituir o GPT-4 pelo novo modelo ajustado
4 comentários
Então isso significa que violaram tanto os termos do GPT-4 quanto a licença do Mixtral...? @_@
Parece ser isso. Como isso não fica muito visível, muita gente acaba pensando assim.
Havia coisas sendo usadas discretamente ou divulgadas para pesquisa,
mas ver alguém promovendo tão abertamente um “nós usamos isso!” é meio... curioso.
Será que não vão reclamar...?
Opiniões do Hacker News