10 pontos por xguru 2023-07-31 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Segundo o leaderboard do AlpacaEval, que avalia automaticamente modelos de linguagem de instruction-following
  • GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
  • O AlpacaEval realiza a avaliação automática usando o conjunto de avaliação do AlpacaFarm e comparando com as respostas geradas pelo GPT-4

Ainda não há comentários.

Ainda não há comentários.