Estado do GPT [vídeo de 42 min]

xguru · 2023-06-01T10:32:01+09:00

Conteúdo apresentado por Andrej Karpathy na Build 2023 Composto por 2 partes Como treinar um assistente (Chat)GPT Como aplicar esse assistente ao seu próprio aplicativo Explica de forma ampla Tokenization, Pretraining, Supervised Finetuning, Reinforcement Learning from Human Feedback etc., além de apresentar estratégias de prompt, várias ferramentas do ecossistema e futuras expansões

(build.microsoft.com)

34 pontos por xguru 2023-06-01 | 2 comentários | Compartilhar no WhatsApp

Conteúdo apresentado por Andrej Karpathy na Build 2023
Composto por 2 partes
- Como treinar um assistente (Chat)GPT
- Como aplicar esse assistente ao seu próprio aplicativo
Explica de forma ampla Tokenization, Pretraining, Supervised Finetuning, Reinforcement Learning from Human Feedback etc.,
além de apresentar estratégias de prompt, várias ferramentas do ecossistema e futuras expansões

2 comentários

kuroneko 2023-06-01

Resumindo, fica assim.

Grandes modelos de linguagem como o GPT são treinados por meio de uma etapa de pré-treinamento com grandes volumes de dados de texto e de um ajuste fino com refinamento para tarefas específicas.
O pré-treinamento envolve prever a próxima palavra em uma sequência para aprender representações gerais da linguagem. O ajuste fino adapta o modelo a uma tarefa específica.
O prompting também pode ser usado para aplicar um modelo de linguagem a uma tarefa sem ajuste fino, fornecendo um prompt para que o modelo gere uma resposta.
O ajuste fino supervisionado treina um modelo assistente usando dados rotulados com prompts e respostas ideais.
O desempenho pode ser melhorado ainda mais com aprendizado por reforço a partir de feedback humano, treinando o modelo assistente para gerar respostas que os humanos avaliem bem.
Técnicas de engenharia de prompt que mostram passo a passo o processo de trabalho do modelo ou fornecem exemplos podem melhorar o desempenho dos modelos de linguagem.
Como os modelos de linguagem não têm monólogo interno nem capacidade de raciocínio como os humanos, o prompting precisa compensar isso.
Dar ao modelo de linguagem acesso a ferramentas externas, calculadoras e bases de conhecimento pode melhorar o desempenho.
Fazer ajuste fino de partes do modelo de linguagem para tarefas específicas pode aumentar o desempenho, mas é mais complexo.
Ainda existem várias limitações nos modelos de linguagem, como vieses, erros de raciocínio e vulnerabilidade a ataques.

xguru 2023-06-01

https://www.youtube.com/watch?v=bZQun8Y4L2A
O mesmo vídeo também está no YouTube, mas no site da Microsoft há suporte a legendas em coreano traduzidas por IA, então estou compartilhando por lá.

Estado do GPT [vídeo de 42 min]

Leituras relacionadas

2 comentários