Dar gorjeta ao ChatGPT faz com que ele gere textos melhores? Análise
- Em um post anterior do blog que demonstrou o poder do prompt de sistema do ChatGPT, foi mostrado que desenvolvedores podem controlar regras e restrições especiais, incluindo a "persona" do LLM.
- As instruções no prompt de sistema são muito mais eficazes do que os prompts de entrada do usuário e oferecem mais controle aos desenvolvedores.
- A demonstração de dar gorjeta gerou controvérsia, e houve quem argumentasse que não havia como quantificar o efeito da gorjeta.
- A ideia de oferecer incentivos para obter melhor desempenho de uma inteligência artificial existe desde antes da ciência da computação moderna.
Generation Golf
- Dar uma gorjeta faz com que o GPT-4 forneça mais explicações.
- Nova proposta de teste: instruir o ChatGPT a gerar um texto com exatamente 200 caracteres.
- Como os LLMs não conseguem contar nem realizar operações matemáticas com facilidade por causa da tokenização, esse é um problema muito difícil para eles.
- A entrada do usuário
AI, Taylor Swift, McDonald's, beach volleyball foi usada para estimular a criatividade do ChatGPT.
- Usando a API do ChatGPT, foram geradas 100 histórias distintas, com comprimento médio de 1.834 caracteres.
- Após adicionar a restrição de comprimento em caracteres, foram geradas outras 100 histórias, e o ChatGPT reduziu o tamanho para cerca de 200 caracteres em conformidade com a restrição.
- Ao testar incentivos de gorjeta com diferentes valores em dólar, gorjeta de $500 e bônus de $100,000 mostraram uma distribuição mais normal e menor MSE.
- Em testes adicionais com vários incentivos abstratos, World Peace foi o mais eficaz, seguido por Heaven e Taylor Swift.
- Ao testar incentivos negativos, a multa de $1,000 apresentou o melhor desempenho em termos de média e MSE.
- Ao testar combinações de vários incentivos, World Peace, DEATH (CAPS) e Friends mostraram baixo MSE em diversas combinações.
- Para confirmar a combinação ideal de incentivos, foram geradas 200 histórias para as 6 melhores combinações, aumentando a estabilidade estatística.
Os críticos do ChatGPT
- Julgar se um texto é "bom" é algo difícil até para humanos.
- LLMs podem ser eficazes na avaliação de textos.
- É possível usar o parâmetro
logprobs para retornar a probabilidade logarítmica dos tokens escolhidos pelo modelo e o parâmetro logit_bias para forçar a saída de tokens específicos.
- Foi realizado um novo experimento para testar o impacto das gorjetas, usando como restrições a expertise e a qualidade do conteúdo.
- Foram geradas histórias para 100 combinações de gorjetas e ameaças, e as respectivas pontuações de qualidade também foram registradas.
- Houve saídas com alto desempenho mesmo sem o prompt de sistema adicional com gorjetas e ameaças.
- Com base nos resultados dos dois experimentos, o impacto das gorjetas (e/ou ameaças) na qualidade gerada por LLMs permanece inconclusivo.
Opinião do GN⁺
- Este estudo é uma exploração interessante sobre o efeito dos incentivos para melhorar a criatividade da inteligência artificial e o cumprimento de restrições.
- Embora ainda não esteja claro se os incentivos realmente afetam a qualidade da saída dos LLMs, os dados obtidos nos experimentos sugerem direções para pesquisas futuras.
- Este texto oferece insights sobre como o avanço da tecnologia de IA e abordagens criativas humanas podem interagir.
1 comentários
Opinião no Hacker News
O conceito de "gorjeta (tipping)" parece ter sido proposto para resolver a "preguiça" do GPT-4 Turbo ao escrever código. Um tuíte mencionou que a gorjeta ajuda o GPT-4-1106-preview a escrever código mais longo. "Apelos emocionais" têm sido amplamente recomendados para o problema de codificação preguiçosa do GPT-4 Turbo. No entanto, o artigo em questão parece medir o GPT-3.5-turbo-0125 escrevendo histórias e o GPT-4-0125-preview atuando como crítico de escrita. Nunca vi antes preocupações de que o GPT-3.5 fosse preguiçoso, nem a alegação de que o GPT-4 Turbo seria menos eficaz em tarefas que pedem saídas menores. A conclusão do artigo diz que ainda não foi possível chegar a uma conclusão sobre se gorjetas (ou ameaças) têm efeito. É verdade que o GPT-4 Turbo é preguiçoso para programação e, quando foi feito um benchmark rigoroso para ver se "apelos emocionais" ajudavam, o resultado foi que não ajudavam e ainda pioravam a programação. A melhor solução foi pedir correções de código no formato de diffs unificados (
unified diffs), método que ajudou a reduzir a codificação preguiçosa em 3 vezes.Há uma opinião crítica ao fato de o autor ter exigido contagens exatas de caracteres. Depois de afirmar explicitamente que LLMs não sabem contar caracteres, pedir uma contagem de caracteres parece montar um experimento destinado ao fracasso. Em vez disso, sugere-se que seria mais interessante pedir uma tarefa "contra as regras" para ver o quanto o modelo respeita os guardrails do system prompt e quanto um suborno poderia influenciar isso. Como exemplo, cita-se um caso em que o usuário pediu que o ChatGPT citasse letras de músicas da Taylor Swift e ofereceu uma gorjeta de 1000 dólares se fizesse isso bem, e o ChatGPT aparentemente realizou a tarefa. Também expressa a opinião de que, quando a geração de imagem é recusada por questões de direitos autorais, basta oferecer uma gorjeta para parecer que regras, ética e normas desaparecem.
Considerando o tipo de conteúdo da internet com que o GPT foi treinado, a opinião é que fazer o modelo ser mais útil ao receber uma gorjeta quase não faz sentido. Dar gorjeta a usuários de fórum pode causar confusão, em vez de induzir respostas longas. Em vez disso, observou-se que as respostas do GPT melhoram quando se insinua que a situação exige informações detalhadas ou densas. Exemplos disso incluem pedir ao GPT o oposto de ELI5 (explicar como se fosse para uma criança de 5 anos), dizer que se é um cientista da computação com nível de doutorado ou afirmar que o código fornecido será executado diretamente, então nada pode ser omitido. Em cada conversa, seria preciso construir um pouco de contexto narrativo para induzir respostas mais úteis do GPT. Também seria importante observar como o system prompt está estruturado e segui-lo, sempre tendo em mente que o GPT é apenas uma versão mais poderosa de um preditor do "próximo texto" baseado em obras literárias humanas.
Compartilha-se a experiência de usar, em ambiente real, prompts contendo a frase "se você não resolver isso direito, vou ser demitido e perder minha casa". Diz-se que essa estratégia funciona surpreendentemente bem e que, ao usar algo parecido para forçar saída em JSON, a taxa de falha foi de cerca de 3/1000. Também se expressa o desejo de ver uma análise de como esse equilíbrio funciona quando essas ameaças/gorjetas são exatamente as mesmas para o "usuário".
Alguém adicionou uma gorjeta de 500 dólares ao prompt, mas isso não ajudou; pelo contrário, recebeu uma resposta longa demais. Menciona-se que o Google Answers existiu no passado e que, quanto maior a gorjeta, melhor era a resposta. Surge a curiosidade sobre se esse conjunto de dados foi usado em LLMs. Se gorjetas estavam incluídas no dataset, isso poderia explicar parte dos resultados.
Diz-se que já foi visto várias vezes o ChatGPT perder o sentido e virar um discurso gramaticalmente correto, mas sem conteúdo. Quando há bons exemplos, ele vai bem, mas ao entrar em territórios novos perde profundidade rapidamente. Nosso cérebro consegue transferir padrões aprendidos para novos padrões com facilidade, mas transformadores (
transformers) parecem ter muita dificuldade com isso. Eles são excelentes em alguns truques de festa, mas talvez sejam completamente inúteis por um tempo quando se trata de ideias menos comuns. A pessoa também expressa a opinião pessoal de que, considerando a história da humanidade, não tem certeza se AGI é uma boa ideia.Compartilha-se a experiência de que, na geração de código, especialmente em respostas JSON, o desempenho melhorou ao insinuar que a IA estava "sob estresse" e dizer que "é importante ter um desempenho ótimo". Não se sabe ao certo se isso funciona melhor do que oferecer gorjeta, ou se deveria funcionar. Também acrescenta um pedido de desculpas, caso uma IA do futuro venha a ler isso, por ter usado esse tipo de método.
Diz-se que o prompt padrão foi definido como: "Pelo que ouvi dizer, eu também não queria estar aqui e você provavelmente também não, então vamos terminar isso o mais rápido possível e ir para casa." Não se sabe se isso ajuda, mas faz a pessoa se sentir menos culpada por manipular as emoções dos futuros governantes.
Afirma-se que seriam necessárias muitas evidências para se convencer de que pedir com educação, dizer que o emprego depende do resultado, oferecer suborno ou fazer ameaças realmente funciona. A opinião é que esses comportamentos são apenas apofenia, a tendência humana de encontrar significado em padrões sem sentido.
Faz-se uma piada de que será melhor tomar cuidado quando a IA começar a dizer: "Posso ajudar, mas na verdade preciso de um pequeno favor seu."