Anthropic revela o modelo de linguagem Claude 2
(anthropic.com)- Melhor desempenho nas respostas, respostas mais longas e acesso por API pública
- Suporta até 100 mil tokens de entrada no prompt
- Ficou melhor em programação, matemática e raciocínio
- Codex HumanEval (teste de programação em Python): melhorou de 56% para 71,2%
- GSM8k (conjunto de problemas de matemática): 85,2% → 88%
- Bar Exam: 73% → 76,5%
- Introduziu várias técnicas de segurança para proteção contra jailbreaks (Constitutional AI, Moral Self-Correction, Red Teaming Language Model)
Ainda não há comentários.