- Uma versão mais rápida e barata, mas com alta capacidade, projetada para lidar com tarefas como conversas do dia a dia, análise de texto, resumo e compreensão de documentos
- Prompt: US$ 1,63 por 1 milhão de tokens, Completion: US$ 5,51 por 1 milhão de tokens
- Cerca de 1/6 a 1/8 do preço em comparação com o modelo Claude 2
- Disponível via API
- Integra os pontos fortes do modelo Claude 2 mais recente e foi muito aprimorado em áreas como matemática, programação, raciocínio e segurança
- Gera respostas mais longas e estruturadas do que o modelo anterior e segue melhor as instruções de formatação
- Também houve melhorias em extração de citações, capacidade multilíngue e perguntas e respostas
- Em matemática e programação, obteve 58,7% no Codex, uma pontuação maior que os 52,8% do modelo 1.1 anterior
- Benchmark GSM8K: 86,7% (1.1: 80,9%)
- Em avaliações automatizadas de red team, a segurança foi reforçada, com menos alucinações e maior resistência a jailbreak
Ainda não há comentários.