OpenAI revela o GPT-4o mini, seu pequeno modelo mais eficiente em custo

xguru · 2024-07-19T11:52:11+09:00

Espera-se que o GPT-4o mini torne a inteligência artificial muito mais barata, ampliando significativamente o alcance de aplicações construídas com IA Obteve 82% no MMLU e atualmente supera o GPT-4 na preferência de chat no leaderboard do LMSYS O preço é de 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída, sendo 10 vezes mais barato que o modelo de ponta anterior e mais de 60% mais barato que o GPT-3.5 Turbo Principais recursos do GPT-4o mini Pode executar uma ampla variedade de tarefas com baixo custo e baixa latência É adequado para aplicações que encadeiam ou paralelizam várias chamadas de modelo (por exemplo, várias chamadas de API) É adequado para aplicações que passam grandes quantidades de contexto ao modelo (por exemplo, uma base de código inteira ou histórico de conversas) É adequado para aplicações que trocam respostas de texto rápidas e em tempo real com clientes (por exemplo, chatbots de suporte ao cliente) Suporta texto e visão na API, com suporte futuro para entrada e saída de texto, imagem, vídeo e áudio Tem uma janela de contexto de 128K tokens, suporta até 16K tokens de saída por solicitação e possui conhecimento até outubro de 2023 Graças ao tokenizador aprimorado compartilhado com o GPT-4o, o processamento de textos em idiomas além do inglês se torna mais eficiente em custo Desempenho superior do GPT-4o mini O GPT-4o mini supera o GPT-3.5 Turbo e outros modelos pequenos tanto em inteligência textual quanto em raciocínio multimodal Suporta a mesma cobertura de idiomas do GPT-4o Tem excelente desempenho em chamada de funções, permitindo que desenvolvedores criem aplicações que buscam dados em sistemas externos ou executam tarefas Apresenta melhor desempenho em contexto longo em comparação com o GPT-3.5 Turbo Obteve 82,0% no MMLU, 87,0% no MGSM, 87,2% no HumanEval e 59,4% no MMMU, mostrando desempenho superior a outros modelos pequenos Medidas de segurança Durante o pré-treinamento, filtra informações que o modelo não deve aprender nem gerar (por exemplo, discurso de ódio, conteúdo adulto, sites focados principalmente em coletar informações pessoais, spam etc.) No pós-treinamento, usa técnicas como aprendizado por reforço com feedback humano (RLHF) para alinhar o comportamento do modelo às políticas e melhorar a precisão e a confiabilidade das respostas O GPT-4o mini incorpora os mesmos recursos de mitigação de segurança do GPT-4o Mais de 70 especialistas externos testaram o GPT-4o para identificar riscos potenciais, que foram tratados, e esses detalhes serão compartilhados no system card e no preparedness scorecard do GPT-4o O GPT-4o mini é o primeiro modelo da API a aplicar o método de instruction hierarchy para melhorar a resistência do modelo a jailbreak, prompt injection e extração do system prompt Preço e disponibilidade O GPT-4o mini já está disponível como modelo de texto e visão nas Assistants API, Chat Completions API e Batch API Desenvolvedores pagam 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída O fine-tuning para o GPT-4o mini será lançado nos próximos dias Usuários gratuitos, Plus e Team do ChatGPT podem acessar o GPT-4o mini a partir de hoje no lugar do GPT-3.5 Usuários Enterprise também terão acesso a partir da próxima semana Planos futuros Reduções significativas de custo estão sendo alcançadas junto com avanços impressionantes na inteligência de IA O custo por token do GPT-4o mini é 99% menor que o do text-davinci-003, introduzido em 2022 A visão é de um futuro em que modelos sejam integrados de forma fluida a todos os apps e sites O GPT-4o mini abre caminho para que desenvolvedores construam e escalem aplicações de IA poderosas com mais eficiência e menor custo O futuro da IA está se tornando mais acessível, confiável e incorporado às nossas experiências digitais do dia a dia

(openai.com)

12 pontos por xguru 2024-07-19 | 1 comentários | Compartilhar no WhatsApp

Espera-se que o GPT-4o mini torne a inteligência artificial muito mais barata, ampliando significativamente o alcance de aplicações construídas com IA
Obteve 82% no MMLU e atualmente supera o GPT-4 na preferência de chat no leaderboard do LMSYS
O preço é de 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída, sendo 10 vezes mais barato que o modelo de ponta anterior e mais de 60% mais barato que o GPT-3.5 Turbo

Principais recursos do GPT-4o mini

Pode executar uma ampla variedade de tarefas com baixo custo e baixa latência
É adequado para aplicações que encadeiam ou paralelizam várias chamadas de modelo (por exemplo, várias chamadas de API)
É adequado para aplicações que passam grandes quantidades de contexto ao modelo (por exemplo, uma base de código inteira ou histórico de conversas)
É adequado para aplicações que trocam respostas de texto rápidas e em tempo real com clientes (por exemplo, chatbots de suporte ao cliente)
Suporta texto e visão na API, com suporte futuro para entrada e saída de texto, imagem, vídeo e áudio
Tem uma janela de contexto de 128K tokens, suporta até 16K tokens de saída por solicitação e possui conhecimento até outubro de 2023
Graças ao tokenizador aprimorado compartilhado com o GPT-4o, o processamento de textos em idiomas além do inglês se torna mais eficiente em custo

Desempenho superior do GPT-4o mini

O GPT-4o mini supera o GPT-3.5 Turbo e outros modelos pequenos tanto em inteligência textual quanto em raciocínio multimodal
Suporta a mesma cobertura de idiomas do GPT-4o
Tem excelente desempenho em chamada de funções, permitindo que desenvolvedores criem aplicações que buscam dados em sistemas externos ou executam tarefas
Apresenta melhor desempenho em contexto longo em comparação com o GPT-3.5 Turbo
Obteve 82,0% no MMLU, 87,0% no MGSM, 87,2% no HumanEval e 59,4% no MMMU, mostrando desempenho superior a outros modelos pequenos

Medidas de segurança

Durante o pré-treinamento, filtra informações que o modelo não deve aprender nem gerar (por exemplo, discurso de ódio, conteúdo adulto, sites focados principalmente em coletar informações pessoais, spam etc.)
No pós-treinamento, usa técnicas como aprendizado por reforço com feedback humano (RLHF) para alinhar o comportamento do modelo às políticas e melhorar a precisão e a confiabilidade das respostas
O GPT-4o mini incorpora os mesmos recursos de mitigação de segurança do GPT-4o
Mais de 70 especialistas externos testaram o GPT-4o para identificar riscos potenciais, que foram tratados, e esses detalhes serão compartilhados no system card e no preparedness scorecard do GPT-4o
O GPT-4o mini é o primeiro modelo da API a aplicar o método de instruction hierarchy para melhorar a resistência do modelo a jailbreak, prompt injection e extração do system prompt

Preço e disponibilidade

O GPT-4o mini já está disponível como modelo de texto e visão nas Assistants API, Chat Completions API e Batch API
Desenvolvedores pagam 15 centavos por 1 milhão de tokens de entrada e 60 centavos por 1 milhão de tokens de saída
O fine-tuning para o GPT-4o mini será lançado nos próximos dias
Usuários gratuitos, Plus e Team do ChatGPT podem acessar o GPT-4o mini a partir de hoje no lugar do GPT-3.5
Usuários Enterprise também terão acesso a partir da próxima semana

Planos futuros

Reduções significativas de custo estão sendo alcançadas junto com avanços impressionantes na inteligência de IA
O custo por token do GPT-4o mini é 99% menor que o do text-davinci-003, introduzido em 2022
A visão é de um futuro em que modelos sejam integrados de forma fluida a todos os apps e sites
O GPT-4o mini abre caminho para que desenvolvedores construam e escalem aplicações de IA poderosas com mais eficiência e menor custo
O futuro da IA está se tornando mais acessível, confiável e incorporado às nossas experiências digitais do dia a dia

1 comentários

wedding 2024-07-22

Pelo visto também vai sair o gpt-4o pro max ultra.