OpenAI revela novos modelos e produtos para desenvolvedores no DevDay

kuroneko · 2023-11-07T09:16:51+09:00

Foram revelados o modelo GPT-4 Turbo com suporte a janela de contexto de 128K, a API do GPT-4 com Vision, a Assistants API, a API do DALL-E 3, o novo GPT-3.5 Turbo e mais. GPT-4 Turbo Suporta janela de contexto (Context Window) de 128K e foi treinado com dados até abril de 2023. Em comparação com o GPT-4, os tokens de entrada são 3 vezes mais baratos e os tokens de saída, 2 vezes mais baratos. Segue melhor instruções para responder em formatos específicos, e também conta com um modo JSON que garante respostas em JSON. Suporta saídas reproduzíveis com base em seed e deve adicionar futuramente um recurso que retorna log probabilities das saídas. O GPT-3.5 Turbo também foi atualizado. Assistants API IA de propósito específico com recursos de interpretador de código, busca e chamada de funções. Gerencia estado com base em threads, permitindo processar conteúdos de comprimento ilimitado. Interpretador de código - permite escrever e executar código Python em um ambiente sandbox. Busca - pesquisa e responde usando conhecimento externo ao modelo, como documentos fornecidos pelo usuário. Chamada de funções - pode chamar apropriadamente funções definidas pelo usuário e incluir os resultados na resposta. Outras novas APIs O GPT-4 Turbo ganhou a capacidade de reconhecer imagens. O DALL-E 3 foi lançado como API, a US$ 0,04 por imagem gerada. Foi adicionada uma API de TTS. Customização de modelos O modelo de fine-tuning do GPT-4 deve ser lançado em acesso experimental. Será oferecido um serviço de modelos sob medida para criar modelos personalizados para grandes organizações. Incluindo treinamento com conjuntos de dados proprietários de mais de bilhões de tokens. Redução de preços GPT-4 Turbo 128K custa US$ 0,01 por token de entrada e US$ 0,03 por token de saída. Em relação ao anterior, os tokens de entrada ficaram 3 vezes mais baratos e os de saída, 2 vezes mais baratos. GPT-3.5 Turbo 16K é oferecido a US$ 0,001 por token de entrada e US$ 0,002 por token de saída. Em relação ao anterior, os tokens de entrada ficaram 3 vezes mais baratos e os de saída, 2 vezes mais baratos; em comparação com o modelo 4K, os tokens de entrada também ficaram 33% mais baratos. O modelo de fine-tuning do GPT-3.5 Turbo é oferecido a US$ 0,003 por token de entrada e US$ 0,006 por token de saída. Em relação ao anterior, os tokens de entrada ficaram 4 vezes mais baratos e os de saída, 2,7 vezes mais baratos.

(openai.com)

9 pontos por kuroneko 2023-11-07 | 8 comentários | Compartilhar no WhatsApp

Foram revelados o modelo GPT-4 Turbo com suporte a janela de contexto de 128K, a API do GPT-4 com Vision, a Assistants API, a API do DALL-E 3, o novo GPT-3.5 Turbo e mais.
GPT-4 Turbo
- Suporta janela de contexto (Context Window) de 128K e foi treinado com dados até abril de 2023.
- Em comparação com o GPT-4, os tokens de entrada são 3 vezes mais baratos e os tokens de saída, 2 vezes mais baratos.
- Segue melhor instruções para responder em formatos específicos, e também conta com um modo JSON que garante respostas em JSON.
- Suporta saídas reproduzíveis com base em seed e deve adicionar futuramente um recurso que retorna log probabilities das saídas.
- O GPT-3.5 Turbo também foi atualizado.
Assistants API
- IA de propósito específico com recursos de interpretador de código, busca e chamada de funções.
- Gerencia estado com base em threads, permitindo processar conteúdos de comprimento ilimitado.
- Interpretador de código - permite escrever e executar código Python em um ambiente sandbox.
- Busca - pesquisa e responde usando conhecimento externo ao modelo, como documentos fornecidos pelo usuário.
- Chamada de funções - pode chamar apropriadamente funções definidas pelo usuário e incluir os resultados na resposta.
Outras novas APIs
- O GPT-4 Turbo ganhou a capacidade de reconhecer imagens.
- O DALL-E 3 foi lançado como API, a US$ 0,04 por imagem gerada.
- Foi adicionada uma API de TTS.
Customização de modelos
- O modelo de fine-tuning do GPT-4 deve ser lançado em acesso experimental.
- Será oferecido um serviço de modelos sob medida para criar modelos personalizados para grandes organizações.
  - Incluindo treinamento com conjuntos de dados proprietários de mais de bilhões de tokens.
Redução de preços
- GPT-4 Turbo 128K custa US$ 0,01 por token de entrada e US$ 0,03 por token de saída.
  - Em relação ao anterior, os tokens de entrada ficaram 3 vezes mais baratos e os de saída, 2 vezes mais baratos.
- GPT-3.5 Turbo 16K é oferecido a US$ 0,001 por token de entrada e US$ 0,002 por token de saída.
  - Em relação ao anterior, os tokens de entrada ficaram 3 vezes mais baratos e os de saída, 2 vezes mais baratos; em comparação com o modelo 4K, os tokens de entrada também ficaram 33% mais baratos.
- O modelo de fine-tuning do GPT-3.5 Turbo é oferecido a US$ 0,003 por token de entrada e US$ 0,006 por token de saída.
  - Em relação ao anterior, os tokens de entrada ficaram 4 vezes mais baratos e os de saída, 2,7 vezes mais baratos.

8 comentários

xguru 2023-11-10

Desde ontem, também aplicamos o GPT-4 Turbo no GN⁺.
Dá para perceber claramente que as respostas ficaram mais rápidas e que ele entende melhor os comandos.
Ele resume bem conforme as instruções e também entrega resultados mais bem acabados.
Antes eu misturava prompts em inglês, mas agora até com prompts só em coreano ele responde muito bem.

botplaysdice 2023-11-08

Não entendo muito bem de IA, mas a velocidade da queda dos preços só deve ficar cada vez mais rápida, né? Realmente não consigo imaginar como será o mundo daqui a 1 ou 2 anos.

tkwlsrl 2023-11-07

O preço por token acima é o preço por 1.000 tokens. Tenha isso em mente.

shw00 2023-11-07

E 128 mil tokens... agora, para os usos que faço, normalmente os problemas de contexto devem desaparecer.

xguru 2023-11-07

Ah, eu estava organizando isso para postar, mas acabei me atrasando T_T

kuroneko 2023-11-07

Thread no HN

Já achei impressionante quando a Anthropic lançou o modelo de 100K, mas agora, com o GPT-4 anunciando 128K tokens, parece que voltou a ficar na frente.
No geral, os preços também caíram várias vezes, então até onde vai a capacidade técnica da OpenAI...?

De qualquer forma, é muito bem-vindo.
O GPT-4 era discretamente caro mesmo, especialmente ao usar 16K, mas agora aumentaram bastante o tamanho de tokens e realmente ficou bem mais barato. +_+

E também fiquei curioso com a Assistants API, acho que vou testar.
Se não precisar usar embeddings para busca, talvez seja ainda mais vantajoso...?

kuroneko 2023-11-07

Resumo em IA da thread do HN.

A OpenAI anunciou novos modelos e produtos para desenvolvedores, incluindo o GPT-4 Turbo com contexto de 128.000 tokens, a Assistants API e preços mais baixos.
Esses anúncios visam aumentar o lock-in na plataforma de API da OpenAI em meio ao aumento da concorrência.
Agentes GPT e assistentes funcionam como uma "caixa-preta dentro de outra caixa-preta", impossível de portar para outros lugares.
O preço do DALL-E 3 é de US$ 0,04 por imagem, 10 vezes mais alto que o dos concorrentes.
O preço do ChatGPT 3.5 com fine-tuning agora é 3 vezes maior, tornando o fine-tuning ainda mais atraente.
O contexto de 128K do GPT-4 Turbo é atraente, mas os modelos open source ainda ficam atrás em precisão e capacidade.
Clientes agora podem pagar de US$ 2 milhões a US$ 3 milhões para pré-treinar modelos GPT-N personalizados com dados proprietários.
Categorias de startups como vectorDB e processamento de arquivos podem ser impactadas, já que a OpenAI passa a oferecer funcionalidades semelhantes.
A OpenAI está tentando levar desenvolvedores a depender de sua plataforma sem considerar os riscos de longo prazo.
Com menos concorrência, desenvolvedores aceitarão riscos como lock-in com base nas necessidades atuais e nos ganhos de curto prazo.

brainer 2023-11-07

Há uma alucinação aí.

Os preços já estão todos escritos.

OpenAI revela novos modelos e produtos para desenvolvedores no DevDay

Leituras relacionadas

8 comentários