7 pontos por xguru 2023-08-11 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Uma versão mais rápida e barata, mas com alta capacidade, projetada para lidar com tarefas como conversas do dia a dia, análise de texto, resumo e compreensão de documentos
    • Prompt: US$ 1,63 por 1 milhão de tokens, Completion: US$ 5,51 por 1 milhão de tokens
    • Cerca de 1/6 a 1/8 do preço em comparação com o modelo Claude 2
  • Disponível via API
  • Integra os pontos fortes do modelo Claude 2 mais recente e foi muito aprimorado em áreas como matemática, programação, raciocínio e segurança
  • Gera respostas mais longas e estruturadas do que o modelo anterior e segue melhor as instruções de formatação
  • Também houve melhorias em extração de citações, capacidade multilíngue e perguntas e respostas
  • Em matemática e programação, obteve 58,7% no Codex, uma pontuação maior que os 52,8% do modelo 1.1 anterior
  • Benchmark GSM8K: 86,7% (1.1: 80,9%)
  • Em avaliações automatizadas de red team, a segurança foi reforçada, com menos alucinações e maior resistência a jailbreak

Ainda não há comentários.

Ainda não há comentários.