LIMA - desempenho próximo ao GPT-4 com um modelo LLaMA de 65B e apenas 1.000 prompts

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" Modelo LLaMA ajustado com fine-tuning usando apenas 1.000 prompts bem curados, sem aprendizado por reforço nem modelagem de preferências Em 43% dos casos, foi considerado equivalente ou preferível ao GPT-4; em comparação com o Bard, 58%; e 65% superior ao DaVinci003 treinado com feedback humano A hipótese do artigo é que quase todo o conhecimento dos LLMs é aprendido durante o pretraining, e que o alignment é um processo simples de aprender o formato/estilo de interação com o usuário Novo artigo da Meta AI

(arxiv.org)

24 pontos por xguru 2023-05-23 | 4 comentários | Compartilhar no WhatsApp

"Less Is More for Alignment"
Modelo LLaMA ajustado com fine-tuning usando apenas 1.000 prompts bem curados, sem aprendizado por reforço nem modelagem de preferências
Em 43% dos casos, foi considerado equivalente ou preferível ao GPT-4; em comparação com o Bard, 58%; e 65% superior ao DaVinci003 treinado com feedback humano
A hipótese do artigo é que quase todo o conhecimento dos LLMs é aprendido durante o pretraining, e que o alignment é um processo simples de aprender o formato/estilo de interação com o usuário
Novo artigo da Meta AI

4 comentários

merong 2023-05-23

O projeto Sejong deveria ter continuado, acumulando em código aberto dados de modelos de linguagem em coreano. Um projeto realmente lamentável...

kuroneko 2023-05-23

É uma pena que o desempenho em inglês esteja evoluindo tão rápido, mas a maioria dos modelos, exceto o GPT, ainda não lida bem com o coreano...

dulco 2023-05-23

O aprendizado de coreano do Claude da Anthropic está em um nível bastante alto, mas ainda há alguns aspectos em que sua fluência difere da do ChatGPT.

test4458 2023-05-23

T_T isso mesmo, em coreano tirando a API do GPT todo o resto é nível lixo...

LIMA - desempenho próximo ao GPT-4 com um modelo LLaMA de 65B e apenas 1.000 prompts

Leituras relacionadas

4 comentários