- Espera-se que o GPT-4o mini torne a inteligência artificial muito mais barata, ampliando significativamente o alcance de aplicações construídas com IA
- Obteve 82% no MMLU e atualmente supera o GPT-4 na preferência de chat no leaderboard do LMSYS
- O preço é de 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída, sendo 10 vezes mais barato que o modelo de ponta anterior e mais de 60% mais barato que o GPT-3.5 Turbo
Principais recursos do GPT-4o mini
- Pode executar uma ampla variedade de tarefas com baixo custo e baixa latência
- É adequado para aplicações que encadeiam ou paralelizam várias chamadas de modelo (por exemplo, várias chamadas de API)
- É adequado para aplicações que passam grandes quantidades de contexto ao modelo (por exemplo, uma base de código inteira ou histórico de conversas)
- É adequado para aplicações que trocam respostas de texto rápidas e em tempo real com clientes (por exemplo, chatbots de suporte ao cliente)
- Suporta texto e visão na API, com suporte futuro para entrada e saída de texto, imagem, vídeo e áudio
- Tem uma janela de contexto de 128K tokens, suporta até 16K tokens de saída por solicitação e possui conhecimento até outubro de 2023
- Graças ao tokenizador aprimorado compartilhado com o GPT-4o, o processamento de textos em idiomas além do inglês se torna mais eficiente em custo
Desempenho superior do GPT-4o mini
- O GPT-4o mini supera o GPT-3.5 Turbo e outros modelos pequenos tanto em inteligência textual quanto em raciocínio multimodal
- Suporta a mesma cobertura de idiomas do GPT-4o
- Tem excelente desempenho em chamada de funções, permitindo que desenvolvedores criem aplicações que buscam dados em sistemas externos ou executam tarefas
- Apresenta melhor desempenho em contexto longo em comparação com o GPT-3.5 Turbo
- Obteve 82,0% no MMLU, 87,0% no MGSM, 87,2% no HumanEval e 59,4% no MMMU, mostrando desempenho superior a outros modelos pequenos
Medidas de segurança
- Durante o pré-treinamento, filtra informações que o modelo não deve aprender nem gerar (por exemplo, discurso de ódio, conteúdo adulto, sites focados principalmente em coletar informações pessoais, spam etc.)
- No pós-treinamento, usa técnicas como aprendizado por reforço com feedback humano (RLHF) para alinhar o comportamento do modelo às políticas e melhorar a precisão e a confiabilidade das respostas
- O GPT-4o mini incorpora os mesmos recursos de mitigação de segurança do GPT-4o
- Mais de 70 especialistas externos testaram o GPT-4o para identificar riscos potenciais, que foram tratados, e esses detalhes serão compartilhados no system card e no preparedness scorecard do GPT-4o
- O GPT-4o mini é o primeiro modelo da API a aplicar o método de instruction hierarchy para melhorar a resistência do modelo a jailbreak, prompt injection e extração do system prompt
Preço e disponibilidade
- O GPT-4o mini já está disponível como modelo de texto e visão nas Assistants API, Chat Completions API e Batch API
- Desenvolvedores pagam 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída
- O fine-tuning para o GPT-4o mini será lançado nos próximos dias
- Usuários gratuitos, Plus e Team do ChatGPT podem acessar o GPT-4o mini a partir de hoje no lugar do GPT-3.5
- Usuários Enterprise também terão acesso a partir da próxima semana
Planos futuros
- Reduções significativas de custo estão sendo alcançadas junto com avanços impressionantes na inteligência de IA
- O custo por token do GPT-4o mini é 99% menor que o do text-davinci-003, introduzido em 2022
- A visão é de um futuro em que modelos sejam integrados de forma fluida a todos os apps e sites
- O GPT-4o mini abre caminho para que desenvolvedores construam e escalem aplicações de IA poderosas com mais eficiência e menor custo
- O futuro da IA está se tornando mais acessível, confiável e incorporado às nossas experiências digitais do dia a dia
1 comentários
Pelo visto também vai sair o gpt-4o pro max ultra.