11 pontos por xguru 2023-07-13 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Melhor desempenho nas respostas, respostas mais longas e acesso por API pública
  • Suporta até 100 mil tokens de entrada no prompt
  • Ficou melhor em programação, matemática e raciocínio
    • Codex HumanEval (teste de programação em Python): melhorou de 56% para 71,2%
    • GSM8k (conjunto de problemas de matemática): 85,2% → 88%
    • Bar Exam: 73% → 76,5%
  • Introduziu várias técnicas de segurança para proteção contra jailbreaks (Constitutional AI, Moral Self-Correction, Red Teaming Language Model)

Ainda não há comentários.

Ainda não há comentários.