Llama 2 Chat 70B supera o ChatGPT (3.5) na avaliação de modelos

xguru · 2023-07-31T10:17:01+09:00

Segundo o leaderboard do AlpacaEval, que avalia automaticamente modelos de linguagem de instruction-following GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37% O AlpacaEval realiza a avaliação automática usando o conjunto de avaliação do AlpacaFarm e comparando com as respostas geradas pelo GPT-4

(tatsu-lab.github.io)

10 pontos por xguru 2023-07-31 | Ainda não há comentários. | Compartilhar no WhatsApp

Segundo o leaderboard do AlpacaEval, que avalia automaticamente modelos de linguagem de instruction-following
GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
O AlpacaEval realiza a avaliação automática usando o conjunto de avaliação do AlpacaFarm e comparando com as respostas geradas pelo GPT-4

Llama 2 Chat 70B supera o ChatGPT (3.5) na avaliação de modelos

Leituras relacionadas

Ainda não há comentários.